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PRÓLOGO 


El texto que presentamos al lector no es un manual de metodología, sino de técnicas de 
investigación y, dentro de esta área, centra el interés en los métodos de survey о 
investigaciones por cuestionarios (preferimos la expresión survey en la medida en que la 
palabra evoca el proceso de investigación antes que el instrumento). El manual está 
escrito con el supuesto general de que las ciencias sociales son ciencias empíricas y 
nomotéticas, cuyo objetivo general es describir, predecir y explicar. 

En el texto no nos interesa tanto la investigación normativa como la investigación 
descriptiva: exponemos al lector una serie de técnicas e instrumentos, señalando su 
modo de construcción, sin profundizar en la racionalidad de los mismos. En la medida en 
que el texto es de carácter introductorio, constantemente invitamos al lector a 
profundizar en los temas, vía literatura especializada en el área y para la cual se 
proporcionan algunas referencias bibliográficas. 

La peculiaridad o característica esencial del tipo de investigación que trata el manual 
está definida por el hecho de que la recolección sistemática de datos se establece a través 
de contactos directos o indirectos con individuos o grupos de individuos, es decir, con 
algún tipo de informante. La encuesta y las pautas de investigación sobre las que trata el 
manual son procedimientos comúnmente utilizados en la investigación social. Existen 
por supuesto numerosas y distintas técnicas y procedimientos, ni menos ni más 
relevantes a la investigación. Los métodos y las técnicas no se definen como apropiadas 
о no apropiadas a priori, sino que dependen del problema que la investigación pretende 
resolver, del estado de avance de la teoría sustantiva y del tipo de pregunta que el 
investigador tratará de responder. 

La problemática teórica define tanto el objeto como los métodos con que se apropia el 
objeto. Las técnicas de recolección de datos, así como la estadística, son instrumentos de 
los cuales se puede servir el investigador, dados sus propósitos teóricos. De ahí que deba 
tomar frente a ellos una actitud a la vez flexible y vigilante. Flexible en el sentido de no 
juzgarlos a priori; crítica y vigilante en el sentido de no utilizarlos automáticamente. 

Pero el manual que sometemos al lector, repetimos, no es un manual de metodología 
y menos de epistemología, sino un manual técnico, si se quiere una especie de 
“recetario” en el que se tratan de señalar y especificar en su mayor amplitud los aspectos 
relativos a la parte operacional de la investigación por encuestas. Partimos de la base de 
que el investigador ha resuelto parcialmente sus problemas teóricos y tiene clara 
conciencia de que, por ejemplo, no tiene sentido aplicar un muestreo aleatorio simple en 
investigaciones que tienen como objeto determinar relaciones estructurales o procesos de 
interacción, ya que por las características mismas del muestreo aleatorio simple se 
destruyen las redes de relaciones que se pretende estudiar. 


El texto comenzó a escribirse en Santiago de Chile, en la Escuela Latinoamericana de 
Sociología, en los años 1966 y 1967, con Ingvar Ahman, entonces experto de la UNESCO 
en la ELAS. Posteriormente Ahman viajó a Suecia y nosotros a Canadá. En nuestro 
reencuentro en México, nos encargamos de replantear la estrategia del manual, quedando 
Padua como principal responsable. Algunos de los capítulos fueron totalmente 
reconstruidos y otros parcialmente modificados. Decidimos conservar de la versión 
original integramente los capítulos de Héctor Apezechea sobre “Codificación” y de 
Carlos Borsotti sobre “Análisis de datos: el concepto de propiedad-espacio y la 
utilización de razones, tasas, proporciones y porcentajes”. 

El capítulo Т, escrito por Ingvar Ahman y Jorge Padua, es de carácter general, y 
sintetiza el manual a través de un diagrama sobre la organización de un survey que 
contiene seis pasos: /) Orientación en el campo de investigación; 2) Construcción, 
evaluación y manejo del instrumento de recolección de datos; 3) La recolección de 
datos; 4) El procesamiento; 5) El análisis y la interpretación, y 6) La presentación. 

Los capítulos subsiguientes toman algunos de los casilleros que aparecen en el 
diagrama de la página 10 y los desarrollan con detalle. 

El capítulo П trata del proceso de investigación, concentrando mayormente su interés 
en la operacionalización de variables y la construcción de índices simples. Fue escrito 
por Jorge Padua. 

El capítulo III trata del muestreo, delineándose algunas indicaciones sobre la 
construcción de muestras probabilísticas y muestras no probabilísticas. Se contempla 
además la idea de Galtung, en su libro Teoría y métodos de la investigación social 
(Eudeba, Buenos Aires, 1966), de la construcción de muestras para la prueba de 
hipótesis sustantivas. El capítulo fue escrito por Jorge Padua. 

El capítulo IV, de Jorge Padua e Ingvar Ahman, trata sobre el cuestionario, 
especialmente en lo referente a los aspectos técnicos en la construcción de los mismos, 
ejemplificando alternativas para la formulación de preguntas y en su ordenamiento. 

El capítulo V, escrito por Héctor Apezechea, está referido a los procedimientos de 
codificación, confección de código y procedimientos de revisión y control. 

El capítulo VI, escrito por Jorge Padua e Ingvar Ahman, presenta una serie de escalas 
para la medición de actitudes, señalando para la mayoría de ellas las técnicas para su 
construcción y comparándolas en términos de su eficiencia como instrumentos de 
medición. 

El capítulo УП, escrito por Ingvar Ahman sobre trabajo de campo en investigaciones 
por cuestionarios, particularmente cuando éstas son realizadas a gran escala, propone 
criterios administrativos importantes para la organización y el buen éxito de la 
recolección del material. 

El capítulo УШ, escrito por Carlos Borsotti, cubre la primera parte del análisis de 
datos y abarca dos áreas importantes: el concepto de propiedad-espacio y algunas 
estadísticas de nivel nominal como razones, proporciones, tasas y porcentajes. El 
capítulo abunda en ejemplos y es una contribución importante a la idea original de A. 
Barton (“The Concept of Property Space in Social Research”, en Lazarsfeld, P., y 


Rosenberg, M.: The Language of Social Research; The Free Press of Glencoe, Illinois, 
1955). 

El capítulo IX, escrito por Jorge Padua, cubre otra parte de la sección dedicada al 
análisis estadístico de los datos. Dada la abundancia en el mercado de textos de 
estadística, hemos preferido integrar el uso de computadoras y la inclusión de paquetes 
estadísticos en ellas, para señalar la oferta y las condiciones para el uso e interpretación 
de un programa: el sPss (paquete estadístico para las ciencias sociales). Desarrollamos 
con mayor detalle en este capítulo la parte correspondiente a los métodos más refinados 
de análisis (análisis de la varianza, análisis factorial, análisis discriminante, análisis del 
escalograma Guttman), dedicando escasa atención a la estadística descriptiva e 
inferencial, material y temas cuyo desarrollo es relativamente más fácil de encontrar en 
el medio. El capítulo está basado principalmente en el texto de Nie, N., Hull, C. H., y 
Jenkins, J. Statistical Package for the Social Sciences; McGraw-Hill, Nueva York, 1975 
(2° ed.). 

El último capítulo, escrito por Ingvar Ahman, se refiere a algunas recomendaciones 
generales sobre la presentación del informe de investigación, señalando algunos criterios 
acerca de lo que debe ser incluido en el mismo, con el fin de facilitar la comunicación 
con la comunidad académica y de investigadores. 

Todos los capítulos han sido escritos de manera tal que puedan ser leídos en forma 
independiente, de ahí que algunos temas aparezcan repetidos a lo largo del libro. Sin 
embargo, su ordenamiento en el texto sigue la lógica del proceso de investigación. 

Las enseñanzas de Ingvar Ahman en la Escuela Latinoamericana de Sociología (ELAS- 
FLACSO), así como su entusiasmo en la idea de publicar un texto accesible en castellano, 
han sido los principales “motivos” para publicar el manual. Desafortunadamente 
responsabilidades con UNDP le impidieron concentrar sus esfuerzos para que el manual 
resultara una responsabilidad editorial compartida. De todas formas, es a Ahman a quien 
expresamos nuestro mayor agradecimiento por su contribución teórica, su participación 
en varios capítulos y su insistencia en buscar un nivel que resultara lo más accesible al 
lector no familiarizado con las matemáticas o con la “jerga” técnica. 

Agradecemos a Claudio Stern por sus útiles comentarios y observaciones críticas al 
borrador de este manual. Nos hemos beneficiado asimismo de los trabajos y 
observaciones críticas de las promociones V y VI de la Escuela Latinoamericana de 
Sociología, principalmente en la primera versión del manual. 

El Centro de Estudios Sociológicos de El Colegio de México y su director, Rodolfo 
Stavenhagen, nos brindaron todo el aliento para emprender la tarea y costearon parte del 
tiempo, permitiendo además que distrajéramos parcialmente nuestra atención de la tarea 
docente y de investigación. 

Guadalupe Luna transcribió el texto a máquina y tuvo que sufrir las atrocidades de mi 
caligrafía y ortografía. 

Todas esas personas e instituciones han desempeñado un papel importante en la 
gestación y carácter del manual y a ellos toda mi gratitud. Sin embargo, la propiedad de 
los errores sigue siendo del dominio exclusivo del autor responsable, confiando en que 


ellos sean tomados con benevolencia. 

Esperamos que el manual tenga utilidad en el terreno para el cual está destinado: los 
cursos introductorios de técnica de la investigación y los investigadores que necesitan a 
menudo consultar sobre aspectos técnicos de la investigación, asuntos que 
desafortunadamente no abundan en la bibliografía especializada. 


JORGE PADUA 


I. LA ORGANIZACIÓN DE UN SURVEY 


JORGE PADUA 
INGVAR AHMAN 


EL OBJETIVO de este capítulo es proporcionar una breve y esquemática introducción 
acerca de la idea de cómo llevar a cabo una investigación de tipo survey. Con el fin de 
clarificar el proceso, usaremos un diagrama en el que señalamos las distintas pautas que 
componen el proceso de investigación. El diagrama no pretende incluir, naturalmente, 
todas las variaciones y diferentes pasos que debe seguir una investigación, sino más bien 
nos servirá de pauta. El campo de las investigaciones tipo survey incluye varias técnicas 
de recolección de datos, pero aquí sólo trataremos en detalle la más utilizada: el 
cuestionario. Otras técnicas, como por ejemplo las observaciones participantes, las 
entrevistas clínicas (en lo que se refiere a datos primarios) y el análisis de contenido y 
otras técnicas (en lo que se refiere a datos secundarios), tienen importancia, pero serán 
tratadas secundariamente en otras secciones de este libro. Los pasos en el diagrama son: 


Paso I: Orientación en el campo de investigación y formulación de un sistema de 
hipótesis. 

Paso П: La construcción, evaluación y manejo del instrumento de recolección de 
datos (cuestionario) y muestreo. 

Paso Ш: Recolección de datos. 

Paso IV: El procesamiento de los datos. 

Paso V: El análisis. 

Paso VI: La presentación. 


Trataremos cada uno de ellos por separado. 


PASO I: ORIENTACIÓN EN EL CAMPO DE INVESTIGACIÓN Y FORMULACIÓN DE UN SISTEMA DE 
HIPÓTESIS 


El primer paso que debe dar el investigador —no importa por quién esté patrocinada la 
investigación o qué motivos lo hayan impulsado a efectuar el estudio— es tener una 
sólida orientación en el campo que va a investigar. Esta orientación se refiere a las 
elaboraciones abstractas de la teoría, a los resultados de investigación y a las particulares 
circunstancias concretas que constituyen el objeto o situación a investigar. 
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Documentación descriptiva: 


La literatura actual y los documentos históricos de información pueden dar luz a los 
problemas que investigará, sobre todo en relación a los aspectos y peculiaridades 
concretas. Una revisión de informaciones de prensa, radio y televisión puede resultar 
también de mucha utilidad, sobre todo cuando se trata de hacer un análisis de contenido 
en investigaciones donde el objetivo es la medición de actitudes u opiniones, por 
ejemplo. 

La consulta de archivos públicos y de documentos oficiales es también útil. Si existe 
el interés o la necesidad de extraer de ellos algunos datos, el trabajo es más arduo, pues 
depende en buena medida de la organización interna del archivo.! 

El estudio puede también recurrir a las informaciones disponibles en archivos 
privados, en los cuales hasta los memoranda y las notas escritas a mano pueden ser 
usados. Debe tenerse especial cuidado con el material estadístico disponible, el cual debe 
ser estudiado detenidamente, ya que la utilidad de este material depende de la manera en 


que fue obtenido y calculado. ? 


Estudio de la situación 


En muchos casos, y si el área de investigación es totalmente desconocida para el 
investigador, es recomendable un primer contacto como observador participante. El 
investigador debe, por ejemplo, vivir con la gente que quiere estudiar; tomar un trabajo 
en una fábrica del mismo tipo que la que va a estudiar, o actuar como espectador en un 
determinado ambiente.” 

Como complemento a los contactos como observador participante, es de gran 
importancia llevar a cabo algunas entrevistas no estructuradas, con algunos sujetos 
llamados “personas clave”. En estas entrevistas hay que buscar que el sujeto entrevistado 
esté en su ambiente natural, de tal modo que pueda contar sus deseos y opiniones con 
referencia a los problemas en los cuales el investigador está interesado, actuando de la 
manera más natural posible. De este modo el resultado de la entrevista es bastante más 
confiable. La persona “clave” puede ser alguien que ocupe una situación destacada 
dentro de una industria, el presidente de un sindicato, algunos periodistas especializados 
en la materia, un político que ha usado el problema en su campaña o labor, etc. La idea 
es utilizar las entrevistas no estructuradas y hacerse un cuadro amplio de la situación y 
de los problemas involucrados, a través de lo que diferentes personas piensan o actúan 
con respecto a estos problemas y de las actitudes que podrían tomar. 


Diagrama del proceso de investigación para un diseño tipo survey, con cuestionario 
como instrumento para la recolección de datos 
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Paso 1 Paso П Paso Ш Paso IV Paso V Paso VI 


Recolección El análisis | La presentación 


de datos 


Orientación en el campo de la 
investigación y formulación de 
un sistema de hipótesis 


Documentación descriptiva 


— Literatura actual 

— Documentos históricos 

— Información periodística 

— Archivos públicos, docu- 
mentos oficiales 

— Datos estadísticos 

— Archivos privados 


La construcción, evaluación y ma- 
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de datos (cuestionario) y muestreo 


El procesamiento de 
los datos 
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Estudio de la situación 


Proceso de 
muestreo 


Entrenamiento de 
entrevistadores 


— Observación participante 
— Entrevistas cualitativas con 
personas clave 


Trabajo de 
campo 


Documentación explicativa 


— Otras investigaciones 
— Literatura explicativa 


Evaluación de 
pre-test. Refor- 
mulación de 
cuestionario 


Cuestiona- 


rio final 


Codificación 


Sistema de hipótesis para 
el estudio 


| Interpretación | 


Estas entrevistas deben ser realizadas por el mismo investigador. El número de 
entrevistas varía de acuerdo con el tamaño e importancia del survey y del campo que el 
investigador estudiará. Habrá casos en que será suficiente con cinco entrevistados, y 
otros en que se necesitarán 30 o más. Es recomendable que, aunque la entrevista se haya 
descrito como no estandarizada, el entrevistador agregue algunos puntos; es decir, que 
fije algunas áreas о preguntas que desee cubrir y entonces espere la reacción del 
entrevistado. Si el sujeto abre nuevos campos de interés, el entrevistador debe seguir 
estos campos, desarrollándolos. 

Con estas entrevistas, un aspecto cualitativo entra en la investigación. Queremos 
acentuar la importancia de esta manera de trabajar, pues luego de la exploración es 
posible comenzar a formalizar la hipótesis o incluso cambiar todo el carácter de la 
investigación. El proceso que sigue todo el primer paso de orientación de una materia y 
la formalización de una hipótesis se concentra en la recolección de datos a través de un 
cuestionario y el análisis estadístico que da a la investigación su carácter principal de ser 
cuantitativa. 


Documentación explicativa 


Aquí se trata de analizar qué han pensado y expresado sobre el problema que nos 
interesa otros autores, cómo han afrontado y formulado el problema, cómo lo han 
resuelto, a qué conclusiones han llegado, cómo han definido sus conceptos, cómo han 
determinado sus observaciones, etcétera. 

Las entrevistas cualitativas son el primer intento para integrar la documentación 
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descriptiva y la conceptualización más o menos generalizada a la situación concreta de la 
investigación particular. A este nivel el investigador comienza a definir sus preguntas 
más específicamente, así como la formulación de sus primeras hipótesis. 

Ahora bien, el investigador debe llevar el sistema al papel. Como ayuda puede 
consultar los resultados de otras investigaciones efectuadas en la misma área. Habrá en 
ellas seguramente algo escrito sobre las variables utilizadas y cómo fueron construidas e 
interconectadas y a qué conclusiones llegaron. Es muy importante consultar la literatura 
explicativa o teórica. A través de ella el investigador puede insertar su estudio particular 
en un marco de referencia teórica más general. 

En algunos casos puede suceder que el investigador prefiera dar a su investigación la 
forma de una réplica a otro estudio ya efectuado o aplicar una parte de un sistema teórico 
y tratar de establecer su aplicabilidad a otra área de la realidad. Este modo de utilizar 
ideas no tiene nada que ver con un “plagio”: por el contrario, es la manera en que la 
ciencia Opera con mayor frecuencia con objeto de avanzar y ampliar el campo de la 
teoría. Por este motivo, en el último capítulo de este libro hemos hecho un llamado a los 
investigadores, pidiéndoles que presenten sus instrumentos (cuestionarios) y hallazgos 
en una forma sistematizada, con objeto de que otros investigadores puedan seguir 
ensayando los resultados una y otra vez. 
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Resumen 


Como un resumen del primer paso de la manera de efectuar una investiga- 
ción survey, recomendamos lo siguiente: 


1) Documentación descriptiva: literatura actual; documentos históri- 
cos; revisión de informaciones de 
prensa, radio y T. V.; archivos pú- 
blicos, documentos oficiales, datos 
estadísticos; archivos privados, do- 
cumentos privados, datos estadís- 
ticos. 


2) Estudio de la situación: observación participante; entrevistas 
cualitativas con personas clave. 


3) Documentación explicativa: otras investigaciones; literatura expli- 
cativa. 


4) Sistema de hipótesis para el es- 
tudio. Ejemplo: 


e a E 1 


МИХ 


А у Е son variables; ——— indica una relación y su dirección 


РАЅО П: LA CONSTRUCCIÓN, EVALUACIÓN Y MANEJO DEL INSTRUMENTO PARA LA 
RECOLECCIÓN DE DATOS (CUESTIONARIO) Y MUESTREO 


En este paso de la investigación se trata de construir un instrumento que sirva para medir 
los conceptos que hemos seleccionado. Los métodos de recolección más utilizados en el 
tipo de investigación que estamos desarrollando son la observación, la entrevista y el 
cuestionario. Luego de un breve resumen descriptivo sobre cada uno de estos métodos, 
concentraremos nuestra atención en el cuestionario como instrumento de recolección de 
datos. 


Observaciones, entrevistas y cuestionarios 


La observación —como método de recolección de datos— se aplica preferentemente 
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en aquellas situaciones en las que se trata de detectar aspectos conductuales, como 
ocurre en situaciones externas y observables. Los cuestionarios y entrevistas se dirigen 
por lo general hacia la obtención de datos no observables directamente, datos que se 
basan por lo general en declaraciones verbales de los sujetos. 

La observación participante, utilizada con gran eficacia por la antropología social, es 
especialmente indicada para propósitos exploratorios, y como señalábamos en los 
párrafos anteriores, forma parte del proceso de familiarización del investigador en el 
estudio de la situación. Aquí el análisis de los datos es simultáneo a la recolección de los 
mismos. El investigador tiene que determinar qué es lo que debe observar y cómo va a 
registrar esas observaciones. Lo que va a observar depende de la teoría en particular 
(implícita o explícitamente formulada). El registro de las observaciones debe hacerse 
tratando de minimizar el error en el registro, al mismo tiempo que evitar distorsionar la 
situación de observación. Por ejemplo, para evitar al máximo los errores de registro, 
productos de distorsiones en la memoria, puede ser conveniente tomar notas, utilizar 
grabadoras, filmaciones, etc. Al mismo tiempo, la utilización de estos mecanismos puede 
llevar a una perturbación en la situación, de manera que se pierda la espontaneidad de la 
misma. Hay que buscar —de acuerdo con cada situación— las soluciones que al 
incrementar la pureza del registro reduzcan la distorsión de la situación. Esto es posible 
mediante el uso de recursos mnemónicos o técnicas similares. Lo que interesa destacar 
aquí es que el investigador debe planear su estrategia anticipadamente, así como 
establecer listas y registros de observación de manera que la observación sea selectiva, 
concentrándose ésta en los detalles sustantivos. 

La observación sistemática es bastante más estructurada que la observación 
participante; se aplica en situaciones de diagnóstico y clasificación en base a taxonomías 
o tipologías ya establecidas, de manera que las categorías de observación ya están 
codificadas, implicando la observación sistemática una tarea de registro bastante menos 
flexible que la de la situación en observaciones participantes. La observación en 
situaciones experimentales es estructurada ya a nivel de estandarización, con el fin de 
elevar el grado de comparabilidad de situaciones similares. 

En el contexto de las investigaciones tipo survey, la entrevista es una técnica de 
recolección de datos que implica una pauta de interacción verbal, inmediata y personal, 
entre un entrevistador y un respondente. Las pautas de interacción entre entrevistador (E) 
y respondente (R) incluyen factores más complejos que el simple intercambio de 
estímulos y respuestas verbales. De esta manera la dinámica de la situación pasa de tratar 


la entrevista como un simple proceso mecánico de recolección de datos a una teoría 


psicológica de la situación de la entrevista, еп la cual —como afirma Hyman—* se 


postula la necesidad de tratar las respuestas individuales como síntomas, más que como 
realidades o hechos. 

Dependiendo del tipo de investigación, las entrevistas se clasifican en estandarizadas, 
semiestandarizadas y no estandarizadas. 

Las entrevistas no estandarizadas se utilizan en etapas exploratorias de la 
investigación, ya sea para detectar las dimensiones más relevantes, para determinar las 
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peculiaridades de una situación específica о para generar hipótesis iniciales. El rasgo 
esencial de este tipo de entrevistas es la flexibilidad en la relación entrevistador- 
respondente, lo que permite un margen tanto en la reformulación de preguntas como en 
la profundización en algunos temas y, por lo general, la ruptura en cualquier orden en 
cuanto a la secuencia en que las preguntas deben ser presentadas. Las preguntas son ya 
muy generales o muy específicas, y el respondente es colocado en una situación en la 
cual se expresa con grados de libertad relativamente amplios. 

Las ventajas que ofrece el abordaje más preciso en un respondente en particular 
contienen las desventajas de este tipo de entrevista en diseños de investigación, en los 
que existe la necesidad de entrevistar a una gran cantidad de respondentes. La primera 
desventaja estriba en la limitación de la comparabilidad entre una entrevista y otra. 
Hyman (op. cit.) señala que en el campo de la antropología, donde esta técnica ha sido 
utilizada con profusión, diferentes observadores han extraído conclusiones distintas 
respecto а un mismo fenómeno. Las entrevistas no estandarizadas se corresponden casi 
exactamente con lo que se llama observación participante, aunque por ésta entendemos 
el proceso total que puede incluir otras técnicas observacionales en la recolección de los 
datos. 

Las entrevistas semiestandarizadas son algo menos flexibles que las no 
estandarizadas. Aquí existe margen para la reformulación y la profundización en algunas 
áreas, combinando algunas preguntas de alternativas abiertas con preguntas de 
alternativas cerradas de respuesta. Por lo general existe una pauta de guía de la 
entrevista, en donde se respeta el orden y fraseo de las preguntas. Preguntas como ¿qué 
es lo que más le agradaría que se reforme en su sindicato? que están planteadas para 
permitir un margen de variabilidad amplio en las respuestas de los sujetos, donde se da a 
éstos oportunidades para que contesten según su propio margen de referencia, su propia 
terminología, etc., anotando, por lo general, textualmente las respuestas, las que 
seguramente serán sometidas a posteriori a un análisis de contenido. 

Las entrevistas estandarizadas y los cuestionarios son prácticamente la misma cosa, 
solamente que se habla de entrevista estandarizada en situaciones en las que el 
cuestionario se aplica por un entrevistador que leerá las preguntas a un respondente. Las 
preguntas son presentadas exactamente como figuran en el cuestionario y en su mismo 
orden. Las preguntas han sido determinadas por el investigador, no permitiéndose por lo 
general que el entrevistador refrasee o introduzca modificaciones. Las preguntas pueden 
ser, y por lo general están, “cerradas”; esto es, se le proporcionan al sujeto alternativas 
de respuesta donde debe seleccionar unas u otras, ordenarlas, expresar su grado de 
acuerdo o desacuerdo, etc. La entrevista estandarizada ofrece algunas ventajas sobre los 
otros tipos de entrevista ya que: a) permite hacer comparable la información proveniente 
de distintos sujetos; b) facilita la medición, que varía en función directa al grado de 
estandarización de la pregunta; c) aparece como más confiable en la medida en que 
existe una constancia en los estímulos; d) minimiza los errores que se puedan introducir 
en el refraseo de preguntas; e) finalmente, en términos de costos de tiempo y facilidad de 
procesamiento de los datos e interpretación, la entrevista estandarizada es insuperable. 


16 


A estas ventajas le corresponden también desventajas: a) existe el problema 
semántico; por más estandarizada que esté una pregunta, no es posible siempre 
estandarizar el significado que tiene cada pregunta para distintos respondentes; b) una 
desventaja adicional está dada por la poca flexibilidad, lo que puede llegar a 
comprometer la situación de comunicación. 

En los párrafos subsiguientes y en un capítulo especial, nos concentraremos con 
mayor detalle en los cuestionarios. 

Los cuestionarios son pues similares a las entrevistas estructuradas. El instrumento de 
recolección de datos, que es el cuestionario, será sometido a un proceso de control 
denominado prueba previa (o pretest) De ese proceso de control resultará un 
cuestionario final, que será utilizado en el paso siguiente, o sea, el de la recolección de 
datos. Podemos hablar entonces de un cuestionario inicial y de un cuestionario final. 

Para efectuar la prueba previa se necesitará entrevistadores y una muestra extraída del 
universo que se trata de estudiar. Estas dos cosas serán analizadas más adelante en el 
texto. 


Cuestionario inicial 


Desarrollamos aquí principalmente los tipos de cuestionarios en los que se utilizan 
encuestadores para obtener los datos. Existe otro tipo de cuestionario autoadministrado 
en el que los propios sujetos leen y registran sus respuestas. 

El cuestionario está compuesto de preguntas, espacio para registrar las respuestas y 
espacio para registrar la entrevista como unidad. 

Denominamos espacio para registrar la entrevista como unidad aquella parte del 
cuestionario que contiene los datos para ubicación de los sujetos, el número que recibirá 
para su identificación, los datos referentes al encuestador, fecha en que ha sido realizada 
la entrevista, su tiempo de duración, etcétera. 

Por espacio para registrar las respuestas entendemos una distribución particular en la 
superficie de la página. A veces es conveniente (para facilitar tanto la lectura y escritura 
por parte del entrevistador como la tarea de análisis de las respuestas) disponer, por 
ejemplo, las preguntas a la izquierda de la página y el espacio para las respuestas y 
comentarios del entrevistador, a la derecha. Las preguntas pueden ser de diferentes tipos. 
Hay preguntas abiertas y cerradas; a veces se aplican también escalas como la Guttman o 
la Likert. Una pregunta en el cuestionario puede corresponder a una variable, aunque 
puede también pertenecer a una de las dimensiones de la variable o a un indicador. Para 
facilitar las respuestas de los R, muchas veces es conveniente reunir las preguntas sobre 
una misma área de interés, en “baterías” de preguntas (se puede consultar más 
información sobre estas áreas en los capítulos sobre el cuestionario y sobre escalas). 

Veamos ahora de dónde salen las preguntas que el investigador va a incluir en su 
cuestionario. Lo más inmediato, y no tan obvio, es que aquéllas deben hacer referencia a 
lo que el investigador quiere estudiar. Las fuentes para la obtención son, entre otras, las 
constituidas por el propio investigador y que se deriven de su sistema conceptual. En 
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segundo lugar, los cuestionarios realizados por otros investigadores. En las entrevistas 
cualitativas encontrará también suficiente material. Lo mismo ocurre con la consulta de 
la bibliografía y los documentos. Por último, haciendo un análisis de contenido del 
material de discursos, de contenido de artículos de prensa, artículos de revistas, diarios, 
comentarios de radio y televisión, que estén relacionados con la temática de la 
investigación, es posible obtener buenas preguntas. 

El problema fundamental de la construcción de preguntas es si la pregunta realmente 
representa la variable, es decir, si el contenido puede servir como indicador de la 
variable. En el caso de una escala, queremos también saber si el contenido de ella indica 
la variable. Además, queremos saber si dentro de la escala todos los ítems indican la 
misma cosa (cualquiera que sea). Se puede, en el proceso del pretest, verificar esto 
comparando las preguntas, estudiando las distribuciones de respuestas y haciendo un 
análisis de consistencia interna de los ítems en la escala (ver la escala Likert). 


Muestra para el pretest 


Cuando el investigador tiene el cuestionario inicial listo con todos sus detalles, procede 
con el pretest, es decir, a aplicar ese cuestionario en una pequeña muestra de la 
población que va a estudiar. Esta muestra para el pretest es diferente de la muestra que 
vamos a aplicar en el paso de recolección de datos, en el sentido de que ahora se trata de 
obtener una muestra pequeña del medio que estamos estudiando y que no coincida con la 
muestra “final”, en el sentido en que una persona que aparezca en el pretest no lo haga 
nuevamente en la muestra final. 

En el caso en que nuestro campo de estudio sean todos los trabajadores de una fábrica 
se puede escoger la muestra para el pretest de los trabajadores de una fábrica similar en 
lo que se refiere a alguna variable fundamental. Lo importante en esto es que la muestra 
del pretest se relacione lo más posible con la muestra final y que el número que se tome 
incluya a unos 30 individuos. Con este número será posible hacer un análisis cuantitativo 
de los datos obtenidos en el pretest al lado de una inspección cualitativa —es decir que 
se pueden estudiar las distribuciones de las categorías de respuestas, calcular promedios 
y estudiar dispersiones y también hacer simples cruces bivariados y además ver si los 
ítems funcionan o discriminan—. Todo esto no será posible si aplicamos el pretest a 
unas 5 u 8 personas, por ejemplo. 

Si el investigador dispone eventualmente de recursos suficientes, no perjudica en 
nada el análisis 51 el pretest es ampliado dos o tres veces; por el contrario, esto acrecienta 
la exactitud del procedimiento. Por supuesto, el tamaño del pretest está ligeramente 
ligado al tamaño del estudio final. Si el estudio final está calculado para 300 individuos 
el pretest es demasiado largo si es de 150 individuos, etcétera. 


Entrevistadores para el pretest 


Es recomendable que el investigador mismo efectúe una gran parte de las entrevistas del 
pretest. Si después va a emplear un gran número de entrevistadores, es recomendable 
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también que algunos investigadores asistentes y los mejores entrevistadores participen en 
el trabajo de campo del pretest. Las razones para esto son las siguientes: hay todavía 
tiempo para aprender algo nuevo con respecto al problema en estudio, que en muchas 
ocasiones puede llevar a la reformulación de la hipótesis; pueden introducirse nuevos 
indicadores; algunas preguntas pueden tener necesidad de ser reformuladas, etc. En el 
pretest el cuestionario inicial no está todavía tan “cerrado” como el cuestionario final; 
algunas preguntas están abiertas, las que luego del análisis del pretest se presentarán 
como preguntas con alternativas cerradas en la etapa de recolección de datos; en general, 
toda la entrevista requiere mucha más sensibilidad durante el proceso que cuando se 
llega al cuestionario final. Por ello, sólo los entrevistadores con bastante experiencia 
pueden participar juntos con el equipo de investigadores. 


Organización y evaluación del pretest 


Si unas 5 personas efectúan de б a 10 entrevistas, la operación puede estar terminada en 
un plazo de dos días. La evaluación del pretest se hace inmediatamente después que se 
han efectuado las entrevistas. Algunos puntos que deben profundizarse son los 
siguientes: 


Examen del cuestionario como un todo y en cada una de sus partes: 


— ¿qué reacción ha tenido el entrevistado con respecto a la entrevista? 

— ¿en qué forma puede lograrse una mayor motivación de parte del R? 

— ¿cuál es la hora (o día) más oportuna para llevar a cabo las entrevistas, y dónde? 
(en el lugar de trabajo, en la casa, etc., dependiendo del tipo de entrevista). 

— ¿cuál debe ser la longitud de la entrevista? 

— ¿en qué orden deben colocarse los diferentes grupos de preguntas (baterías)? Por 
ejemplo: preguntas sobre deportes, preguntas personales, preguntas sobre aspectos 
económicos o políticos. 

— ¿existe alguna posibilidad de que el orden de los grupos de preguntas dañe el 
resultado de la entrevista? (Por ejemplo, colocar una pregunta sobre ingreso al 
comienzo del cuestionario. Ver el capítulo sobre el cuestionario.) 


Examen de cada una de las preguntas: 


— ¿es necesaria la pregunta? 

— ¿podría reformularse? 

— ¿podría agregarse una pregunta suplementaria? 

— las respuestas alternativas que se han dado son: ¿suficientes? — ¿demasiadas? — 
¿no se aplican? 

— ¿hay suficiente espacio? ¿Están escritas de modo que se eviten confusiones? 


Al mismo tiempo, o más tarde, hay que estudiar la frecuencia de la distribución de las 
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respuestas (distribuciones marginales). En relación con la forma de la distribución, se 
deciden las respuestas alternativas finales. A través de este estudio podemos decidir 
cuándo es necesario presentar la pregunta en una forma dicotomizada o tricotomizada o 
51 dejaremos más posibilidades de respuesta о la pregunta directamente en forma 
“abierta”. Si se presentan algunas dudas, es preferible presentar una completa escala de 
alternativas, ya que una dicotomización o tricotomización puede hacerse siempre 
después, pero lo contrario no es posible; es decir, si sólo dejamos dos alternativas en la 
escala, no podremos producir después cuatro, en caso de necesitarlas. En relación con 
esto, se hace una simple tabulación cruzada de las variables más importantes, con el 
objeto de obtener la primera verificación del resultado de la hipótesis. Las tabulaciones 
cruzadas están limitadas a cuadros bivariados, debido al número restringido de casos. 

A menudo no se presentan a los R en el pretest las preguntas con distintas categorías 
de respuestas, sino más bien preguntas abiertas. Esto ocurre cuando el investigador no 
cree conveniente exhibir las diferentes respuestas entre las cuales el R debe elegir, 
pensando en que de hecho el sujeto o bien no sabe nada acerca del problema, o que 
indicándole las posibles respuestas podría distorsionar la imagen que sobre el objeto 
tiene el sujeto. En el primer caso, las respuestas deben ser analizadas después y, si se 
cree conveniente, clasificar las diferentes respuestas en alternativas que figurarán en el 
cuestionario final con el objeto de facilitar tanto el trabajo del entrevistador como la 
codificación posterior. 

Sin embargo, muchas veces el investigador entrega ya en el pretest las preguntas 
cerradas, en cuyo caso se instruye a los entrevistadores para que lean las alternativas y 
soliciten a los R que elijan la respuesta que consideren más exacta o que se ajusta más a 
su manera de pensar. 

El último paso en el proceso de evaluación consiste en ordenar y enumerar las 
preguntas y tipificar el cuestionario nuevamente. Antes de esto, el equipo tiene que 
decidir 51 es necesario efectuar un segundo pretest о 51 con el primero se ha llegado а 
resultados satisfactorios. Ahora vamos a dejar la parte del pretest y a pensar más en otros 
requisitos que deben prepararse con la finalidad de proceder a la recolección final de 
datos (paso Ш). 

Necesitamos una muestra para el trabajo de campo que no tiene que estar mezclada 
con la muestra del pretest; necesitamos también entrenar a los entrevistadores frente al 
trabajo de campo. Este último trabajo se hace en relación con el cuestionario final que se 
debe tener listo después de la evaluación del pretest. 


Diseño de la muestra 


Si fuera posible, debiera investigarse toda la población. En la mayoría de los casos, la 
población es muy numerosa y el presupuesto del investigador, limitado. Por lo tanto, 
debe efectuarse una representación al azar de la población. El tipo de diseño de la 
muestra que debe utilizarse depende del objetivo del estudio, y de la unidad de análisis 
que se utilizará, de su distribución geográfica y de la distribución de las otras variables 
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fundamentales. En uno de los capítulos de este libro se entrega una corta introducción 
referente a los principales tipos de muestras probabilísticas y no probabilísticas. 

Hay varias maneras de construir muestras, y la pregunta que tiene que responder el 
investigador es qué representa realmente la muestra para su estudio. En caso de que el 
estudio sea descriptivo y queramos predecir la distribución en la población (valores 
paramétricos) la muestra debe ser probabilística. Pero cuando el estudio tiene como 
objetivo establecer las relaciones entre variables de tipo exploratorio, la probabilidad no 
es el único e indispensable requisito. 

Para mostrar la relación entre la fuerza de gravedad, tiempo y longitud, Newton no 
necesitó recurrir a una muestra representativa de todos los objetos pesados del mundo, 
para incluirlos en una situación experimental. Muchas veces da más seguridad de 
predicción el hecho de mostrar la misma tendencia en una muestra pequeña una y otra 
vez durante distintos periodos que elaborar una investigación grande que explique todo. 

No es necesario que el investigador domine, en un estudio sociológico, cada aspecto 
teórico de la muestra, pero sí es un requisito indispensable la cooperación de un estadista 
en el caso en que sea necesario. Desgraciadamente los diseños de muestras demasiado 
complejos no pueden ser aplicados, puesto que las informaciones fundamentales en las 
cuales la muestra ha sido tomada son incompletas, impracticables, etcétera. 


Entrenamiento de los entrevistadores 


En los países en que los entrevistadores para hacer estudios no son profesionales, el 
investigador tiene que seleccionar y entrenar un buen equipo. El proceso de selección y 
entrenamiento de los entrevistadores puede empezar junto con el pretest (en el cual, 
además, pueden intervenir algunos entrevistadores). Normalmente el investigador 
encuentra las personas apropiadas entre los estudiantes de su misma y/o de diferentes 
disciplinas. 

Si suponemos que las personas no poseen experiencia anterior en entrevistas, el 
primer paso es procurarse un cuestionario estándar para el entrenamiento. Este 
cuestionario incluye diferentes tipos de preguntas, hojas sueltas para responder e 
instrucciones para los entrevistadores. A éstos deben dárseles algunas lecciones acerca 
de la teoría de la entrevista y de la aplicación de los cuestionarios. En seguida, hay que 
reunirlos en pequeños grupos, con el cuestionario de entrenamiento de entrevistas que ha 
preparado. Luego, hacer que uno entreviste a otro ante el investigador que sigue el 
procedimiento cuidadosamente (en suma, un juego de role-playing). 

Hay equipos técnicos más avanzados, que se llaman laboratorios de entrevistas. Estos 
“laboratorios” pueden consistir en algunas salas especialmente preparadas con 
micrófonos y amplificadores y también una sala de conferencias, con un espejo one уау. 
Naturalmente, esta forma de preparar a los entrevistadores pertenece más a instituciones 
grandes en universidades. Estos “laboratorios” permiten llegar a cursos regulares en los 
cuales el participante recibe un diploma y tiene oportunidad de ingresar en un grupo 
profesional de entrevistadores con su propio código de ética, etc. Sin embargo, 
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reduzcamos las aspiraciones a la versión más accesible presentada: el investigador 
efectúa una selección de entrevistadores en esta primera visita de entrenamiento. Ni las 
personas demasiado tímidas ni las que presumen de su excelencia como entrevistadores 
llegan a ser buenos entrevistadores. Toda persona que trate de predisponer la entrevista a 
uno и otro lado no es recomendable. Para predecir 51 una persona va a ser buen o mal 
entrevistador, una experiencia vasta como entrevistador y los estudios teóricos de la 
entrevista por parte del investigador serán de gran ayuda. 

Habrá siempre un relativo grado de ventaja en la tarea de llevar a cabo las entrevistas 
a largo plazo. Entrevistadores que son excelentes en un tipo de estudio pueden ser 
mediocres en otro; y entrevistadores que han sido mediocres en el comienzo de la 
colección de datos pueden resultar las mejores personas para convencer a los R que en 


un principio rehusaron ser entrevistados.” 

Cuando el investigador tiene un equipo de entrevistadores capaces y bien entrenados, 
el cuestionario de la investigación final se presenta junto con las instrucciones para los 
entrevistadores. Llevará algún tiempo al entrevistador manejar todos los formularios y el 
cuestionario. Antes de empezar el trabajo en el campo, el equipo de investigación debe 
cerciorarse de que los entrevistadores han comprendido estas instrucciones y dominan el 
cuestionario, pues de lo contrario sólo conseguirían verse confusos o inseguros (ver 
también el capítulo sobre la organización del trabajo de campo). 


РАЅО Ш: LA RECOLECCIÓN DE DATOS. EL TRABAJO EN EL CAMPO 


El trabajo en el campo debe planearse y llevarse a cabo con precisión y seguridad. En un 
estudio de tamaño normal, digamos de unos 500 casos, la parte principal de las 
entrevistas (un 70%) debe ser obtenida en un plazo de cinco días después de su 
comienzo en el campo de trabajo. El número de entrevistadores y recursos deben 
calcularse sobre estas cifras. Por supuesto que depende mucho del tipo de estudio que se 
lleve a efecto. Algunas entrevistas tienen lugar en áreas rurales, otras en parte de 
ciudades que no tienen muchos medios de comunicación. De todos modos, no es 
necesario justificar una demora demasiado prolongada de la recolección de datos, por 
causa de dificultades que pudieran producirse. En muchos estudios es fácil encontrar 
dificultades de diferentes tipos. 

Si el estudio se va a llevar a cabo en un pueblo, por ejemplo, se puede enviar allí a 
unos 30 entrevistadores por un periodo de cinco días, que vivan cerca de la central de 
entrevistas (podría, perfectamente, ser un hotel), con instalaciones de teléfonos y 
comunicaciones y en un lugar céntrico. Los entrevistadores están precisamente para 
cierto propósito y para eso se les está pagando. 

Los R se dividen de tal modo que todos queden próximos. А cada sector geográfico se 
le da un entrevistador, etc. Los entrevistadores, por ejemplo, tendríamos que informar 
por cada cinco entrevistas a la central, con objeto de que dichas entrevistas sean 
debidamente verificadas, etc. Serán cinco días sobrecargados, pero posiblemente el 
estudio será realizado de una manera eficiente. 
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Un problema en toda recolección de datos primarios es el tipo de dificultades que se 
presentan para obtener el total de las entrevistas. Hablamos de pérdida de datos. La 
pérdida de datos puede ser en la forma de pérdida de la entrevista entera o de parte de 
ella. En el primer caso, es la pérdida de la unidad, y en el segundo, es un vacío en la 
matriz de datos. Nos preocuparemos aquí de la primera posibilidad. 

La gente puede rehusar las entrevistas por diversas causas imaginables. En una 
encuesta al azar de 500 R una serie de inconvenientes puede aparecer. No es fácil tomar 
simplemente a alguna otra persona para sustituir los individuos que rehúsan la entrevista. 
Sin embargo, existe cierto porcentaje de entrevistas que el investigador obtendrá 
fácilmente, digamos alrededor del 70-75%, y hay un 20% dificil de obtener. Mientras 
más alto sea el porcentaje que deseemos obtener, más alto será el costo y el trabajo que 
tendremos en las últimas entrevistas. Teóricamente, podríamos viajar a Europa, por 
ejemplo, para obtener las entrevistas de algún R que está allí de visita durante el tiempo 
de nuestra investigación. El costo, sin embargo, y el tiempo ponen límite a los altos 
porcentajes y tenemos que continuar el estudio sin lograr el 100%. Todo lo que se 
obtenga superior al 90% es aceptable, si usamos los estrictos criterios mencionados. 

Es necesario recordar algo que justifique el rigor de nuestro criterio: el último grupo 
de 10% que obtenemos es un grupo socialmente especial en el sentido de que son 
personas difíciles de ubicar. Podría tratarse de una específica forma de personalidad que 
rehúse todo lo que se haga en sociedad, incluyendo las entrevistas; podrían ser personas 
inestables y difíciles de localizar; podría tratarse de enfermos, etc. Esto es, 
probablemente un grupo más interesante de estudiar con respecto a algunas de nuestras 
variables y por eso no puede ser sustituido por otro tipo de personas. 


PASO IV: EL PROCESAMIENTO DE DATOS 


Bajo el título de procesamiento de datos encontramos subtítulos como “codificación”, 
“perforación”, “reproducción”, etc. En la siguiente representación introductora del 
proceso de un estudio tipo survey, tocaremos muy brevemente algunos aspectos y 
dejaremos que el lector investigue sobre el particular en otros capítulos del libro. 


Codificación 


Codificación es el traslado de categorías de respuestas a un lenguaje simplificado (cifras) 
con el objeto de efectuar el proceso de análisis dentro del espacio adecuado en la tarjeta 
IBM u otras tarjetas perforadas. 

En el proceso de codificación usamos una lista de códigos que, como un diccionario, 
da la correspondiente connotación de una categoría en otro idioma. Damos a 
continuación un ejemplo de código: 
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Pregunta Columna 


: Variable : Código Alternativas 
num. num. 
56 Ingreso familiar 71 і Menos de Е° 400 
mensual en escudos 2 > de E* 400 < Е° 800 
(Chile), 1968 3 > de Е° 800 < Е° 1.200 
4 > де Е° 1.200 < Е° 1.600 
5 > де Е° 1.600 < Е° 2.000 
6 > de Е° 2.000 < Е° 3.000 
7 > de Е° 3.000 


Se puede estudiar más en detalle la codificación en el capítulo que trata el asunto. 


Perforación de las tarjetas 


Cuando los datos crudos han sido codificados en una hoja especialmente dibujada para 
estos fines o simplemente se han codificado en el cuestionario en uno de los márgenes, el 
próximo paso es perforar las cifras en las columnas de la tarjeta de datos. De este modo, 
obtendremos para cada individuo una tarjeta (o un grupo de tarjetas si el número de 
variables es numeroso); dentro de la tarjeta, cada columna o grupo de columnas 
representará una variable o una “pregunta” en el cuestionario; en cada columna la 
posición corresponderá a la respuesta alternativa escogida por el R. 

La perforación es un procedimiento relativamente rápido. Las tarjetas necesitan 
también ser verificadas y pueden ser reproducidas con el objeto de obtener una o más 
copias del juego inicial de tarjetas. Todo este trabajo es efectuado por máquinas 
especiales que pueden ser alquiladas comercialmente. En muchos departamentos 
universitarios y otras instituciones científicas existe, además, una oficina especial para 
computaciones que ofrece esta clase de servicios. 

Una pregunta es de especial importancia para el investigador con respecto al 
procesamiento de datos: ¿cuándo es recomendable usar computadoras, cuándo una 
clasificadora y cuándo simples técnicas, como la técnica con tarjetas Mc Bee, o 
simplemente hacer el análisis directamente en tablas, sin transferir el material a tarjetas? 
Esto depende del número de casos que tenga el estudio, el número de variables utilizadas 
y de la complejidad del análisis que se quiere utilizar. 

Para un pretest con más o menos 30 a 50 casos, las tarjetas Mc Bee habitualmente 
ofrecen la mejor solución. Para un estudio de alrededor de 200 a 600 casos con un 
número de variables no muy grande y con el fin de no complicar el procedimiento 
analítico, las tabulaciones cruzadas en un simple distribuidor de tarjetas (clasificadora) 
es el más económico de los métodos en tiempo y dinero y permite cambios inmediatos 
en el plan de análisis. Para materiales más amplios, una computadora ofrece la mejor 
alternativa. 

Usando máquinas clasificadoras corrientes, máquinas estadísticas о servicios de 
computadoras, el investigador obtiene las distribuciones de sus variables con sus 
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respectivas características, como promedios, dispersiones, etc. A partir de esta 
información, procede a diseñar un plan para el análisis. 


PASO V: ANÁLISIS 


A través de la información obtenida de los datos, el investigador continúa su labor 
haciendo un proyecto de tabulaciones cruzadas, incluyendo correlaciones, tests de 
significación estadística y otros procedimientos analíticos que desee aplicar y que se 
corresponden con su sistema de hipótesis. 


PASO VI: PRESENTACIÓN 


La presentación final de los hallazgos deberá ser efectuada de tal manera que muestre 
sus resultados en forma sistemática y compacta. Asimismo, la presentación debe incluir 
un apéndice metodológico en el cual el cuestionario y otros detalles en la recolección de 
datos y proceso se encuentren debidamente explicitados. Esto se realiza con objeto de 
hacer más fácil a otros científicos la investigación del sistema empleado, efectuar 
réplicas y reconstrucciones de preguntas y cuestionarios y, de esta manera, avanzar en la 
teoría. 


COMENTARIOS FINALES 


51 vemos el diagrama al inicio de este capítulo, en el que se aprecian los diferentes pasos 
que sigue una investigación, notamos una flecha entre el paso V y el paso I. Esta flecha 
representa la interconexión del paso de análisis con el paso lógico de la formulación de 
nuestra hipótesis. Este paso representa la interpretación y consiste en confrontar los 
resultados hipotéticos que se derivan de la teoría con los hallazgos empíricos. La 
confirmación de una hipótesis o la refutación de la misma tienen consecuencias 
importantes; y a este respecto es importante justificar, por ejemplo, tanto la presencia 
como la ausencia de correlaciones. Es señal de poca ética profesional presentar en el 
informe de investigación solamente aquellos hallazgos que coinciden con nuestras 
hipótesis o, peor, con nuestros puntos de vista, e ignorar los que no coincidan. 

Cuando analicemos en el próximo capítulo el proceso de investigación, notaremos la 
manera de ver una investigación tipo survey como un pasaje entre el sistema de hipótesis 
y el análisis con el trabajo de corrección de datos ubicado en una forma intermedia. Es 
decir, al suprimir el paso I y el У, no habrá una investigación explicativa. Suprimiendo 
los pasos intermedios П, Ш y IV, no habrá verificación empírica del І y no se puede 
tampoco efectuar el paso V. 
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П. EL PROCESO DE INVESTIGACIÓN 
JORGE PADUA 


EL PROCESO de investigación está constituido por una serie de partes íntimamente 
relacionadas. Del conocimiento de tal interconexión y de su manejo correcto a lo largo 
de toda la dinámica del proceso dependerá el resultado sustantivo de la investigación 
misma. 

Las partes principales del proceso aparecen enumeradas en el diagrama del capítulo 
anterior. De esas partes, son dos las que desempeñan un papel fundamental: el marco 
teórico y el análisis. La recolección de datos en sí, cualquiera que sea su grado de 
sofisticación, es un instrumento que garantiza el paso del marco teórico a la verificación 
del mismo. 

La afirmación expresada en el parágrafo anterior se hace más explícita cuando se 
entiende que el marco teórico inicia el proceso y da lugar a una problemática expresada 
a priori, en la forma de un conjunto de proposiciones que, si se presentan en forma 


aislada, caracterizarán un estudio como descriptivo; si están interconectadas о 


interrelacionadas con otras proposiciones, lo caracterizarán como explicativo. ! 


Todo problema de investigación comienza siempre como un problema de 
teorización.? La primera tarea del investigador es la de la codificación de la realidad, y 
esa codificación sólo puede ser realizada según una teoría (implícita o explícita). Matilda 
Riley? presenta un diagrama del proceso de investigación que concentra el interés en las 
tres partes principales del proceso: la teoría, los métodos empíricos para la recolección y 
la realidad o fenómenos sociales concretos. El diagrama aparece a continuación. 


Métodos empíricos 


Diseño 


Fase empírica 


Fase interpretativa 


и а mae sae e a 


| Fenómenos sociales concretos 


Hallazgos de investigación 
(hechos ordenados) 


Modelo conceptual 


Métodos de interpretación 


La teoría sociológica es el conjunto de proposiciones y definiciones extraídas de la 
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realidad social y que explican los fenómenos sociales concretos. El modelo conceptual 
es construido a partir de términos generales, definiciones y supuestos de la teoría o de 
una porción de ella. Este modelo señala cuáles son los problemas más significativos, las 
maneras como se seleccionarán los datos, la selección del diseño más correcto, así como 
la búsqueda de orden o de patrones entre ellos y la interpretación de los hallazgos de 
investigación. 

El objetivo de la investigación señala los elementos en el modelo que van a ser 
investigados; pero, repetimos, es el modelo el que señala los supuestos que están por 
detrás de los elementos. Sin embargo, los objetivos de la investigación pueden ser 
también la selección de un modelo. 

El diseño de investigación se refiere al conjunto particular de métodos seleccionados 
por el investigador tanto para la búsqueda de nuevos hechos como para la determinación 
de sus conexiones. Aquí se decide cómo se van a seleccionar los datos, cuáles serán los 
métodos analíticos, cómo se va a formular el problema, qué tipos de instrumentos 
específicos se van a utilizar, cómo se va a realizar el pretest, etcétera. 

En la fase empírica el investigador es guiado por la teoría sociológica, y el modelo 
hacia los fenómenos sociales concretos que, en términos de hechos sociales, contrastarán 
sus hipótesis teóricas. 

En la fase interpretativa se comparan los hechos con su teoría inicial examinando las 
consecuencias que tienen para la teoría la comprobación o refutación de las hipótesis. 

Así, pues, el problema básico es un problema de teorización. Sin embargo, cuando se 
habla de teorización, por lo general se hace referencia a dos niveles distintos, pero 
relacionados: a) el nivel conceptual y racional de conceptualización, que define el 
significado nominal de una ciencia, y b) el nivel de teorización para la investigación, es 
decir, el nivel empírico, que le da el significado operacional a una ciencia. 

Ambos niveles de teorización están relacionados en el sentido de que debe existir una 
correspondencia real entre el significado nominal de una ciencia y su significado 
operacional; es decir, debe existir un isomorfismo entre ambos niveles para que el 
resultado de la operación científica sea conocimiento. 

Hay todo un problema epistemológico en las ciencias sociales que proviene de la falta 
de correspondencia entre el significado nominal y el significado operacional, dificultad a 
la que se han propuesto algunas soluciones parciales, que desafortunadamente por su 
carácter de parciales no han resuelto el problema de una manera satisfactoria. Por el 
carácter práctico e introductorio del manual, tocaremos muy de lado la consideración de 
las soluciones propuestas, prefiriendo enfrentar el problema desde una perspectiva 
diferente. 

Los problemas de teorización pueden ser vistos desde la teoría hacia la investigación, 
o desde la investigación hacia la teoría. Si bien esto no significa desplazar el problema 
de la ausencia de isomorfismo entre los niveles de significación y los niveles 
operacionales, sí implica un desplazamiento de la importancia relativa que se da a los 
enfoques en la resolución del problema. Si uno mira el problema desde la teoría hacia la 
investigación, la preocupación deviene casi exclusivamente epistemológica; si la 
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perspectiva va de la investigación а la teoría el problema es más técnico, más 
pragmático. No se trata de dar a una u otra perspectiva un status superior o inferior. Si 
tomamos la perspectiva técnica en este texto, lo hacemos conscientes de que, si bien las 
soluciones se concentrarán en problemas operacionales, éstas dependerán —sin ninguna 
duda— de los resultados y del nivel alcanzado por la disciplina en la resolución de sus 


problemas a nivel sustantivo.* 

Por operacional debe entenderse una solución que corresponda al nivel de las 
necesidades pragmáticas de realizar una investigación empírica, sin dejar de lado los 
problemas de significado nominal. La aclaración es válida, sobre todo para diferenciar 
operacional de operacionalismo; esto es, de la práctica que consiste en suprimir los 
significados nominales en beneficio de operaciones específicas y uniformes. 


DISTINTOS TIPOS DE INVESTIGACIONES 


La investigación científica tiene como sus objetivos teóricos más generales dar 
respuestas inteligibles, confiables y válidas a preguntas específicas o problemas de 
investigación. Las respuestas se dan por lo general en términos de qué (o cómo), dónde, 
cuándo, de dónde y por qué. Sin embargo, no toda investigación tiene como propósito 
responder a todos los interrogantes, existiendo la posibilidad de que se trate de responder 
solamente a alguno de ellos. Toda investigación comienza, pues, con algún tipo de 
interrogante, que tratará de ser resuelto en los términos citados. 

La formulación del problema de investigación es uno de los pasos principales y más 
difíciles de resolver en cualquier diseño de investigación. El tipo particular de estilo 
cognoscitivo de una investigación de carácter científico exige del investigador no 
solamente claridad en la formulación del problema a investigar, sino también 
especificidad en términos del tipo de respuesta que se busca a tipos específicos de 
preguntas. 

Si en un comienzo los intereses del investigador pueden ser de carácter muy amplio, 
en términos de la investigación concreta siempre hay que tener bien claro qué es lo que 
se está buscando, y el tipo de información que dará la respuesta a sus preguntas. Por 
ejemplo, el investigador puede tener como área de interés general aspectos vinculados al 
sindicalismo, e imponerse como objetivos buscar la resolución de algunos interrogantes 
sobre sus características, organización, etc. Pero para los propósitos de la investigación, 
el problema tiene que ser formulado de manera más específica, buscando las respuestas 
al nivel de los cinco interrogantes formulados más arriba. Hay que plantear preguntas 
tales como: ¿cuántos sindicatos hay?, ¿quién los dirige?, ¿cómo están organizados?, ¿con 
qué tipo de ideología operan?, ¿a qué tipo de sindicalismo representan?, ¿cuáles son las 
relaciones con las bases?, ¿por qué se dan esos tipos y no otros?, etcétera. 

La bibliografía especializada acostumbra diferenciar los estudios o diseños de 
investigación —según el tipo de pregunta que el investigador plantee— en estudios 
exploratorios, descriptivos y explicativos. 

Los estudios exploratorios son preponderantes en áreas o disciplinas en donde las 
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problemáticas no están suficientemente desarrolladas, de manera que el investigador 
tiene como propósito “ganar familiaridad” con la situación antes de formular su 
problema de manera específica. 

Por ello, antes que concentrarse en observaciones particulares, la estrategia de 
investigación consiste en buscar una mayor dispersión posible en las observaciones. En 
las ciencias sociales, donde las teorías no están formuladas en forma precisa, los estudios 
exploratorios son necesarios ya sea para la precisión o examen en profundidad de 
algunos de los supuestos de la teoría, para la construcción de esquemas clasificatorios 
provisionales, para detectar algún modelo aún no formulado en forma explícita, o bien 
para facilitar la generación de algunas hipótesis que serán puestas a prueba 
posteriormente con algún diseño explicativo. Aquí es conveniente repetir que el 
investigador siempre opera con alguna clase de “modelo” conceptual, con alguna clase 
de “teoría” sobre la naturaleza del fenómeno o de la situación; por eso la dificultad 
principal de la aproximación exploratoria puede residir en la creencia, por parte del 
investigador, de que puede desprenderse a voluntad de sus estereotipos o prenociones. 

En la medida en que el tipo de estudios exploratorios involucra por lo general un tipo 
de “inmersión total” del investigador en la situación, éstos han sido tradicionalmente 
preferidos por antropólogos y algunos psicólogos sociales, utilizando la observación 
participante como técnica para la recolección de datos. 

Un obstáculo importante para este tipo de estudios puede sintetizarse en el efecto que 
dos vertientes tienen sobre la validez interna y externa de los resultados de la 
investigación: a) problemas de error, particularmente cuando se utiliza como técnica de 
recolección de datos algún tipo de observación participante (por ejemplo, se producen 
modificaciones en la estructura de los grupos, en el comportamiento de los miembros, 
existiendo escasez de control sobre los sesgos potenciales que el investigador pudiese 
introducir en el registro de la información, etc.), y b) problemas de comparabilidad con 
otras investigaciones del mismo carácter, y que en general se derivan de la falta de 
sistematización. 

Los estudios descriptivos son más específicos y organizados que los estudios 
exploratorios, ya que las preguntas aparecen guiadas por taxonomías, esquemas 
descriptivos o tipologías; en estos estudios el interés está enfocado en las propiedades 
del objeto o de la situación a ser clasificadas en el interior de estos esquemas. Los 
estudios descriptivos dan por resultado un diagnóstico. 

Hanz Zetterberg? sistematiza en forma precisa las aproximaciones que enfatizan 
definiciones y las que enfatizan proposiciones, sistematización que permite una 
distinción bastante clara en los diferentes significados de la palabra “teoría”, según ésta 
responda al interrogante de los porqués o al de los cómos; esto es, según enfoque su 
interés en la explicación o en la descripción. 

La palabra “teoría” se reserva para los sistemas proposicionales, es decir, aquéllos 
donde la unidad es la proposición, y donde las proposiciones ordenadas constituyen el 
sistema de organización conceptual que, aplicado a las unidades de interés de la 
disciplina, da por resultado una explicación. 
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La palabra “taxonomía” se aplica a la interrelación de definiciones; una taxonomía es 
un esquema de definiciones ordenadas que definen tanto el objeto de interés de una 
disciplina como las propiedades del objeto o de la situación a los que hay que prestar 
atención. La aplicación de la taxonomía a un nuevo objeto permite un diagnóstico o una 
descripción. En un apéndice adjunto a este capítulo presentamos ejemplos de taxonomía 
en botánica y psicología y una tipología sociológica. 

Los estudios explicativos dan respuestas a los porqués. La respuesta se ubica dentro 
de la lógica de las explicaciones científicas, a través de teorías organizadas de manera tal 
que dan cumplimiento a la condición doble de verificación lógica y de verificación 
empírica. Lógica en el sentido de consistencia entre las proposiciones que integran el 
sistema; empírica en el sentido de correspondencia del sistema proposicional con la 
realidad empírica. En la fase explicativa de la investigación, el investigador separa — 


como dice Piaget—? lo verificable de lo reflexivo o intuitivo, elabora métodos adaptados 
a la problemática, métodos que son a la vez de análisis y de verificación. 
El concepto de “ley” pasa a desempeñar un papel importante en el aparato conceptual. 


Mario Bunge” especifica cuatro significados distintos de la palabra “ley científica” que 
resultan de extrema utilidad tanto para la especificación de los problemas como para la 
determinación del nivel de preguntas que plantea una investigación de carácter 


explicativo. La especificación de Bunge sigue de cerca las preguntas que Zetterbergs 
sugiere que se realicen a una disciplina, para la determinación de su grado de 
cientificidad. 

Para la ejemplificación de los cuatro significados de la ley científica, seguimos de 
cerca a Bunge y su ejemplo de la ley de Newton del movimiento: 

1) El primer significado de ley científica (significado ontológico), para Bunge, es la 
ley como denotando toda relación constante y objetiva en la realidad; es decir, la ley 
como estructura nómica, de pautas invariables al nivel óntico, como pauta objetiva. La 
ley del movimiento de Newton sería la expresión de una pauta objetiva del movimiento 
mecánico, pauta que no sería ni verdadera ni falsa sino que simplemente es. 

2) El segundo significado de la palabra ley es la ley como enunciado nomológico o 
como enunciado de ley; es decir, una hipótesis general que tiene como referencia la ley 
entendida en su primer significado. En este caso la ley es una pieza de conocimiento, 
expresado en forma proporcional. Este tipo de enunciado nomológico nace del hecho de 
que, en la medida en que no es posible captar las leyes en su significado óntico en toda 
su pureza, se construyen estos enunciados nomológicos que pertenecen a un modelo de 
la realidad, modelos que son ideales y que son reconstrucciones cambiantes de las leyes 
objetivas en el pensamiento científico. Estos enunciados nomológicos son lógicamente 
necesarios en la medida en que entran en conexión con otros enunciados nomológicos; 
pero son fácticamente contingentes en la medida en que los enunciados son perfectibles, 
o solamente válidos en cierto dominio. En el ejemplo de la ley del movimiento de 
Newton, el enunciado de ley se expresa en la designación de la fórmula “fuerza = masa x 
aceleración”. 

3) El tercer significado de ley es la ley como enunciado nomopragmático, que 
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designa toda regla mediante la cual puede regularse una conducta. En este caso la ley 
opera como regla de acción, mediante la cual, siguiendo el ejemplo de Newton, es 
posible predecir o controlar la trayectoria de cuerpos. Aquí la ley denota relaciones 
invariantes a nivel pragmático, que operan como guías para la acción con fundamento 
científico, ya que se derivan de los enunciados nomológicos. Esta distinción entre 
enunciados nomopragmáticos y nomológicos es importante según Bunge, ya que nos 
permite establecer una distinción entre explicación y predicción. Los enunciados 
nomológicos constituyen sistemas lógicamente organizados u organizables, que sirven 
para la explicación. Los enunciados nomopragmáticos, que se derivan de los enunciados 
nomológicos, son las herramientas para la predicción. 

4) Finalmente, el cuarto significado de la palabra ley es la ley como enunciado 
metanomológico, que designa todo principio general acerca de la forma y del alcance de 
los enunciados de ley. Aquí estamos a nivel de la ley como prescripción metodológica, 
en la medida en que los enunciados metanomológicos son enunciados explícitos de leyes 
acerca de las leyes que sirven de guía para la construcción de teorías. El significado de 
ley está entendido como cierta pauta de la conducta humana en relación con cierto tipo 
de objetivos y cierto tipo de datos empíricos. 


TEORIZACIÓN EN LA INVESTIGACIÓN 


Puede hablarse entonces de dos niveles de teorización, el nivel taxonómico (donde se 
hace hincapié en las definiciones y cuyo resultado será una taxonomía o una tipología o 
un esquema clasificatorio); y de un nivel teórico proposicional, la teoría propiamente tal, 
donde se incluye tanto el problema de las definiciones conceptuales cuanto la 


interrelación de proposiciones con el propósito de explicar? 

Los conceptos y constructos incluidos en el nivel de la teoría son abstracciones 
formuladas a partir de generalizaciones de observaciones particulares, que son definidas 
nominalmente y que proporcionan el nivel de significado o de sentido del sistema. Los 
constructos y los conceptos tienen significados similares, siendo los constructos 
conceptos de un nivel más alto de abstracción que tienen como base conceptos de un 
nivel de abstracción de bajo nivel. Conceptos y constructos son introducidos en la teoría 
por medio de definiciones o por medio de operaciones. En el caso de ciencias empíricas 
se trata de desarrollar un sistema conceptual que tanto a nivel de definiciones nominales 
como de definiciones operacionales permita el contraste de la teoría con la realidad. 

Los conceptos entonces describen los fenómenos y en general tienden a ser de dos 
tipos: conceptos categóricos que son complejos y que se miden a nivel de categorías 
nominales; y las variables que representan dimensiones de los fenómenos admitiendo 
grados de variación que se miden a niveles ordinales, intervalares o racionales. 

El concepto es pues un nombre, hay que agregarle una definición. Cuando se ordenan 
conceptos y definiciones se obtienen esquemas descriptivos que nos sirven para 


clasificar o diagnosticar la realidad. 
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Las definiciones”” son una forma de “explicar”, si atendemos al significado 
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etimológico de la palabra (desplegar, hacer las cosas planas, más claras, más 
comprensibles). Pero en las “explicaciones”, por definición, solamente existe un 
intercambio de símbolos. La definición implica pues un problema semántico, y el 
objetivo principal es la clarificación de significados. Esta clarificación de significados es 
el primer paso importante en la clarificación de eventos. Además, y ése es el fundamento 
de todos los sistemas definicionales, facilitan la comunicación a nivel profesional, 
homogeneizando el lenguaje. 

Se acostumbra diferenciar dos clases principales de definiciones, existiendo dentro de 
cada una de las clases diferentes tipos: 

a) Las definiciones nominales. Son simples convenciones lingüísticas que no 
expresan ningún valor de verdad. Son simplemente una indicación sobre cómo utilizar el 
lenguaje, y cuyos significados son dados en forma relativamente arbitraria. Este tipo de 
definición opera solamente en el nivel simbólico y lingüístico, y son juzgadas en relación 
a su utilidad. Esto es, entre dos definiciones, no es el caso discutir sobre cuál es la más 
verdadera, sino cuál es la más útil. De las definiciones nominales la más utilizada es la 
convencional aristotélica, en la que se definen los fenómenos por medio de dos 
atributos: un genus proximum y una differentia specifica; el genus proximum es un 
atributo que el fenómeno o concepto a definir comparte con una clase más amplia de 
fenómenos, y la differentia specifica, un atributo peculiar a la categoría definida. En 
resumen, una definición nominal introduce una nueva expresión, ya sea a través de una 
nueva palabra o de un símbolo o de una frase compuesta por medio de una serie de 
criterios racionales. 

b) Las definiciones reales. Operan en el nivel simbólico y además en el nivel 
referencial. Las definiciones reales son en sí hipótesis que expresan un valor de verdad. 
Una definición real, para ser válida, necesita ser probada empíricamente como tal. Por 
consiguiente, las definiciones reales se juzgan en función de su valor de verdad y se 
establecen mediante la investigación empírica. Lo que el investigador busca mediante 
una definición real no es solamente lo que la palabra significa, sino cuáles son los 
referentes del concepto y cuáles son sus propiedades observables. 

Una definición real, en un sentido más estricto, es un tipo particular de proposición: 
una proposición universal afirmativa. Por ejemplo, cuando definimos “hombre” como 
bipedo implume, estamos implicando que cualquier cosa que sea bípeda e implume es 
hombre, y que cualquier hombre debe ser bípedo e implume. Si bien toda definición real 
es una proposición, no toda proposición es una definición real, en la medida en que estas 
últimas no solamente tienen consecuencias lógicas, sino además ontológicas; esto es, 
tienen significado real y significado empírico. La proposición “todos los hombres son 
mortales” es verdadera como proposición lógica, pero no es una definición real, ya que 
no todos los mortales son hombres. 

Carl Hempel (op. cit.) establece una diferenciación importante entre definiciones 
reales, definiciones analíticas y definiciones empíricas, que es muy útil, ya que permite 
hacer más flexible el concepto de “definición real” tradicional, demasiado sujeto a las 
nociones de atributos y de naturaleza-esencia. Para Hempel las definiciones analíticas 
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requieren como criterio de validación solamente una reflexión sobre los significados de 
las expresiones que las constituyen, mientras que las definiciones empíricas requieren el 
análisis empírico. Más adelante presentamos algunos ejemplos de P. Lazarsfeld, que 
basándose en las conceptualizaciones de Hempel, sugiere un método para la 
operacionalización de variables, mediante la idea de pasaje de conceptos a indicadores. 


Proposiciones e hipótesis 


Cuando se conectan conceptos tenemos un juicio teórico; por ejemplo: a más alta la 
extracción de clase de un alumno, mayor la probabilidad de que éste tenga un 
rendimiento alto en la escuela primaria. Estas conexiones entre conceptos están 
justificadas tanto a nivel teorético, cuando el investigador provee las razones acerca de 
por qué los conceptos deben conectarse de esa forma y no de otra (por ejemplo, en el 
juicio anterior aduciendo el efecto de la socialización diferencial por clase social, las 
expectativas de los maestros, etc.), cuanto a nivel operacional, es decir, a nivel de cómo 
se conectan los conceptos, especificando los parámetros del juicio (por ejemplo, 
especificando si la relación es lineal, curvilinear o potencial; si los coeficientes 
representan la unidad o una fracción de ella; si la relación es positiva o negativa). 

Proposiciones, hipótesis y enunciados se utilizan por lo general como sinónimos, 
aunque en el sentido técnico pueden significar cosas distintas. Por lo general, los 
investigadores hablan indistintamente de proposición o de hipótesis, mientras que los 
epistemólogos utilizan con mayor frecuencia las palabras “enunciado”, “proposición” e 
“hipótesis” con un carácter más preciso. 

Por proposición vamos a entender “cualquier generalización que puede probarse 
como consistente o inconsistente con respecto a otras generalizaciones que forman parte 
del cuerpo organizado de conocimiento; las proposiciones científicas, además, deben ser 
sometibles, directa о indirectamente, a la verificación empírica”. Una hipótesis es un 
juicio de carácter conjetural. Para W. 1. Beveridge,'' la hipótesis “es la técnica mental 
más importante del investigador y su función principal es sugerir nuevos experimentos o 
nuevas observaciones”. Cuando se habla de hipótesis, por lo general el investigador se 
ubica en una lógica de tipo deductivo, donde las hipótesis son algunas implicaciones de 
la teoría que esperan verificación. 

Para Zetterberg (op. cit.) las proposiciones teoréticas o de alto valor informativo son 
aquellas que “pueden ser probadas como incorrectas por un gran número de distintas 
maneras”, esto es, las que dan cuenta de una gran variedad de eventos. Galtung define 
las hipótesis como conjunto de variables interrelacionadas y una teoría como conjunto de 
hipótesis interrelacionadas.'? 

Como puede verse, no existe distinción sustancial entre la definición de proposición 
de Zetterberg y la definición de hipótesis de Galtung. En el fondo están hablando de la 
misma cosa: Galtung, desde la perspectiva de la matriz de datos, y Zetterberg, desde las 
teorías de la axiomatización. Para los propósitos de la investigación empírica, los 
criterios de Galtung son algo más operacionales que los de Zetterberg. El primero 
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sostiene que una hipótesis es una oración o sentencia acerca de cómo se distribuyen ип 
conjunto de unidades en un espacio de variables. Para el lenguaje de la matriz de datos, 
las hipótesis tienen la forma siguiente: a) se da una unidad (mesa, clase social); b) una o 
más variables (color, participación política); с) las variables tienen valores (rojo, azul, 
etc.; alta, media, baja); d) puede hacerse referencia a un conjunto de unidades con más 
de un elemento, y e) puede referirse a un atributo o propiedad de la unidad. 

A diferencia de Zetterberg, Galtung concibe hipótesis de una variable (descriptiva): 
esta mesa es verde y alta; de dos variables: a mayor clase social, mayor participación 
política; o multivariatas, en cuyo caso comenzamos a hablar de sistema de hipótesis, tal 
como, por ejemplo, aparece en el diagrama del capítulo Т, donde además de hacer 
referencia a un atributo o propiedad de una unidad, establecemos vínculos —que pueden 
ser causales— ya sea entre distintas propiedades de una unidad, ya sea de interrelación 
entre distintas unidades y propiedades. 

Hasta aquí lo que importa destacar es la idea de explicitar las proposiciones o 
hipótesis. Es aconsejable hacer algunos esfuerzos para llegar a un máximo de 
axiomatización de la teoría, entendida ésta como sistema proposicional о de hipótesis. 

La explicitación de las proposiciones y de las definiciones, y su tratamiento teórico a 
través de la reducción de matrices (combinando proposiciones con definiciones о 
proposiciones con proposiciones), tienen la ventaja de hacer visibles todas las ideas 


implícitas en algunas ideas dadas.!* 

Una vez explicitadas las proposiciones, el siguiente paso es la verificación de éstas (si 
se trata de hipótesis/proposiciones aisladas) o de las interrelaciones entre las 
proposiciones, en esquemas multivariatos. 

La verificación en el caso del conjunto de proposiciones interconectadas consiste en 
ver cuán bien (cualitativa y/o cuantitativamente) se ajusta esta estructura con la 
estructura empírica que indican los datos. 

Aunque la idea es simple, de ningún modo es sencilla. Llegar a la formalización no es 
tarea nada fácil, principalmente porque nuestras disciplinas están en etapas embrionarias 
en lo que a especificación de estructuras causales se refiere (y sobre el problema de la 
causalidad misma aún no se ha dicho la última palabra). 

Por otra parte, no hay todavía acuerdo sobre qué se entiende por algún concepto dado 
o por algún otro. Más técnicamente, como expresamos líneas arriba, no hay taxonomías 
completas y es insuficiente el trabajo que se hace por desarrollarlas y, como sabemos, 
poco puede la teorización sin buenas taxonomías y las taxonomías sin buenas 
teorizaciones. 

Pero es una excelente manera de operar y hay muchos investigadores que no la 
utilizan. Consideremos nuestro medio: es práctica muy utilizada el que, en base a 
algunas inquietudes más o menos difusas, y en todo caso bien implícitas, se recogen 
primero los datos y luego se fabrica la teoría, según lo que den los cuadros. En el mejor 
de los casos, en estas investigaciones se publicarán algunas caracterizaciones generales. 
En el peor, las investigaciones terminan en la recolección de datos, acumulando 


cuestionarios o tarjetas perforadas y guardándolos en un rincón de alguna oficina.!* Y es 
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por ello que volvemos a señalarlo: no se insiste como es debido еп la teorización у en la 
dinámica del proceso de la investigación. 


CONCEPTOS, INDICADORES, ÍNDICES 


Como último punto, como ejemplo de una de las maneras de trabajar, queremos exponer 


la operacionalización de algunas de las dimensiones de la personalidad autoritaria,” a 


través de las ideas desarrolladas por Lazarsfeld y colaboradores! sobre el pasaje de los 
conceptos a los índices empíricos. Podría decirse que es el paso de un concepto a una 
variable. 

Supóngase un sistema de hipótesis (o de proposiciones) o un número de 
proposiciones que pretendan describir o explicar aspectos relacionados con elementos de 
la personalidad que puedan predisponer formas de reacciones hostiles frente a ciertos 
grupos raciales. A partir de esta idea general, es necesario comenzar con la 
especificación y organización de la forma como se abordará el tema de investigación. 

Lo que aquí nos interesa es que, una vez que uno haya explorado la literatura 
existente, y se hayan formulado las proposiciones, se debe tomar cada uno de los 
conceptos que involucran las proposiciones y proceder a operacionalizarlos para poder 
aprehenderlos en forma empírica. Retomemos el caso de la “personalidad autoritaria”. 
La idea principal de los autores es que la personalidad humana funciona como un todo, 
de manera que sus convicciones políticas, económicas y sociales son el reflejo de 
aquellas tendencias profundas de su personalidad. 

La idea de Lazarsfeld es que el paso de los conceptos a los índices incluya cuatro 
etapas: 4) La imagen inicial. B) Las dimensiones. C) Los indicadores. D) La formación 
de los índices. 

A) En la imagen inicial el o los autores tienen lo que puede calificarse como una idea 
más о menos vaga del concepto. A través de estudios de la bibliografía existente, tanto 
de la dedicada a la teoría como a la investigación, los autores han llegado a una imagen 
más clara del concepto, entendiendo por imagen más clara la posibilidad de poder 
realizar la segunda etapa, esto es: 

B) La descomposición del concepto original en las dimensiones que lo componen. 
Antes de ver lo que trataron Adorno y colaboradores, damos un ejemplo de otro tipo: la 
inteligencia es un concepto complejo, cuyas dimensiones son inteligencia verbal, 
espacial, manual, numérica, abstracta, etc.; la participación política es otro concepto 
complejo, cuyas dimensiones pueden ser la forma de participación, los valores frente al 
sistema y actitudes, etcétera. 

Adorno y colaboradores trabajaron cuatro dimensiones de la ideología general del 
autoritarismo. Éstas son: 1) el antisemitismo; 2) el etnocentrismo; 3) el conservadurismo 
político-económico, y 4) las tendencias antidemocráticas implícitas. 

En cada una de estas dimensiones Adorno y colaboradores llegaron a establecer 
nuevas dimensiones (o subdimensiones, si queremos seguir nuestro razonamiento). No 
analizaremos todas las dimensiones, pero tomemos una como ejemplo: la más conocida 
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es la de las tendencias antidemocráticas implícitas. Este concepto de tendencias 
antidemocráticas implícitas incluye 9 dimensiones (o subdimensiones) que son las 
siguientes: 

1) Convencionalismo (conventionalism). 

2) Sumisión autoritaria (authoritarian submission). 

3) Agresión autoritaria (authoritarian aggression). 

4) Anti-intracepción (anti-intraception). 

3) Superstición y estereotipia (superstition and stereotipy). 

6) Poder y dureza (power and “toughness ”). 

7) Destructividad y cinismo (destructiveness and cynicism). 

8) Proyectividad (projectivity). 

9) Sexo (sex). 

C) El paso siguiente consiste en encontrar los indicadores para cada una de estas 
dimensiones. Y éstas son las preguntas concretas que se les hicieron a los sujetos para 
que respondieran según su grado de acuerdo o desacuerdo. Por ejemplo, la dimensión 
convencionalismo operó con algunos de los siguientes indicadores: 

Ítem 1: “La obediencia y el respeto por la autoridad son las principales virtudes que 
debemos enseñar a nuestros niños”. 

Ítem 37: “Si la gente hablara menos y trabajara más, todos estaríamos mejor”. 

Ítem 9: “Cuando uno tiene problemas o preocupaciones, es mejor no pensar en ellos y 
ocuparse de cosas más agradables”. 

Ítem 41: “El comerciante y el industrial son mucho más importantes para la sociedad 
que el artista y el profesor”. 

Una pequeña acotación al respecto es que no nos parece correcto el procedimiento 
empleado por los autores de utilizar los mismos indicadores para una serie de 
dimensiones. Por ejemplo, el ítem: “Si la gente hablara menos y trabajara más, todos 
estaríamos mejor” aparece como indicador de convencionalismo, agresividad autoritaria 
y anti-intraceptiva. Si bien es aceptable que aquellas dimensiones estén 
intercorrelacionadas, esto no es demostrable utilizando este procedimiento, ya que el 
hecho de estar utilizando los mismos ítems hace que la correlación (si es que la hay) 
aparezca exagerada.!” Además, esto es un caso claro de tautología. 

D) El paso final es recomponer el concepto original, uniendo las partes. Esta unión de 
partes es llamada aquí formación de índice. En el caso de los autores que tratamos, el 
concepto tendencias antidemocráticas implícitas es recompuesto a través de una escala 
(que es una forma particular de índice) bastante conocida como Escala F. 

En un diagrama, los pasos a seguir en la operacionalización serían 
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Esta gráfica estaría indicando el paso del concepto a los indicadores. El paso de 
“retorno” de los indicadores al “nuevo” concepto (variable) puede tener mayor o menor 
grado de refinamiento, dependiendo de los objetivos de la investigación y/o del grado de 
precisión que se desee. 

Este paso final de recomposición del concepto en un índice es la parte final de 
operacionalización del concepto en variable. 

La palabra variable es entendida, en un sentido bastante amplio, como algo que 
“varía”, e incluye lo que podría denominarse atributo (nivel de medición nominal, donde 
la variación se da simplemente como un problema de distinción de clase), a cuasi 
variables (mediciones de nivel ordinal, donde además de distinciones de clase se hacen 
distinciones de grado en términos de rango), o de variables propiamente tales (niveles de 
medición intervalar y racional). 


Dimensiones 


Indicadores 


Índices 


Los índices son síntesis de varias expresiones numéricas, y en nuestro caso particular el 
índice es la reconstitución de un concepto original que ha sido dimensionalizado y a cada 
dimensión se le han asignado diversos indicadores. Nos referiremos aquí principalmente 
a los índices sumatorios simples y a los índices ponderados. La adjudicación de índices 
simples comprende una serie de operaciones matemáticas relativamente arbitrarias, 
especialmente si se comparan con las escalas (ver capítulo sobre “Escalas рага la 
medición de actitudes”). 

Utilizamos índices sumatorios simples: a) cuando las mediciones son el resultado de 
una combinación de puntajes adjudicados arbitrariamente; por ejemplo, a las respuestas 
“de acuerdo” les adjudicamos un puntaje 2, y a las respuestas “en desacuerdo”, un 
puntaje 0; b) cuando los puntajes arbitrarios son indicadores de algunas dimensiones que 
queremos expresar en una cifra única; c) cuando el concepto no es escalable, esto es, 
cuando no podemos asumir la existencia de un continuo subyacente. 

Construcción de índices. La construcción de un índice comienza a partir de algunos 
indicadores que pueden ser respuestas a alternativas (acuerdo-desacuerdo; sí-no; 
empleado-desempleado; urbano-rural; primaria incompleta-universitaria completa- 
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universitaria incompleta; valores porcentuales de urbanización, etcétera). 

En la mayoría de los casos conviene que los valores asignados a cada una de las 
alternativas sean números enteros y positivos, sobre todo en aquellos casos donde el 
número asignado simplemente significa la asignación a una clase (medición nominal) o 
un orden de rango (medición ordinal). Conviene asegurarse también de que los valores 
del índice sigan la dirección de la variable, esto es, los números altos deben expresar los 
valores altos en la variable. Estos procedimientos nos ayudan en el proceso de 
interpretación, sobre todo cuando se calculan medidas de asociación y de correlación. 

La amplitud del índice depende tanto de la cantidad de preguntas o de indicadores 
como de la cantidad de alternativas en cada uno de los indicadores. El valor mínimo del 
índice (si todos los indicadores tienen alternativas que expresen los valores mínimos con 
el número 0) será 0. Supongamos que tenemos un índice compuesto de 3 indicadores, 
cuyas alternativas de respuestas y pesos son, respectivamente: 


Educación 
SAA O 0 
Primaria incompleta ...................................... 1 
Primaria completa .................................. 2 
Secundaria completa o incompleta ........... 3 
Universitaria completa o incompleta ........ 4 

Ocupación 


Trabajadores manuales no especializados, asalariados y por 


cuenta OA ОЛУМ Наана лаар: 0 
Trabajadores manuales especializados, asalariados y por 

CUCA Propia ааа EAR E E E а dd 1 
Personal de supervisión ........................... rro rra nnannnnnnes 2 


Empleados de administración pública, privada y de comercio 
de grado П y comerciantes minoristas ................................ 3 
Empleados de administración pública, privada y de comercio 


de grado I y propietarios medianos ...................................... 4 
Jefes menores e intermedios de administración pública, 
privada ý сотегсіо ыяшка cena ea аера: 5 
Grandes empresarios y altos ejecutivos .................................... 6 
Ingreso 
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Menos de 1 000 pesos ................ Ú 
de 1000 а 2999 pesos ............. 1 
de 3000 а 4999 pesos ............. 2 
de 5000 а 6999 pesos ............. 5 


de 7000 a 8999 pesos ............. 4 
de 9000 a 10999 pesos ............. 5 
de 11000 a 12999 pesos ........ ie. Ü 
de 13000 а 14999 pesos ............. 7 
КЕЛИН o ib caia 08 


Al índice resultante le llamamos de status socioeconómico, y tendrá un valor mínimo 
de 0 y un valor máximo de 18. Los valores extremos del índice (0 y 18) son el resultado 
de combinaciones únicas de indicadores (sin educación —no manual— con ingresos 
inferiores a 1 000; y universitaria completa o incompleta —grandes empresarios— con 
ingresos de 15 000 pesos o más). Los valores intermedios pueden ser el resultado de 
pautas diferentes. Por ejemplo, un puntaje 10 puede ser el resultado de varias 
combinaciones: 


— Educación universitaria-personal de supervisión—Ingreso entre 7 000 y 8 999, 

— Educación primaria completa—pequeño propietario de comercio-ingresos entre 9 000 y 10 999. 

— Educación secundaria completa-empleado de administración pública de grado Il-ingresos entre 7 000 y 8 
999. 


El índice de status socioeconómico presentado como ejemplo tiene un problema 
adicional relativo al peso que tiene cada indicador. El peso máximo está en ingreso 
(representa 45% del valor total del índice); seguido por ocupación (33% del valor), y 
finalmente por educación (22%). 

A menos que existan razones teóricas importantes que justifiquen la asignación 
diferencial de pesos, conviene asignar a los distintos indicadores la misma cantidad de 
alternativas (en el ejemplo presentado se pueden aumentar las alternativas de respuesta 
en educación). 

Las alternativas de respuesta pueden ser construidas a partir de criterios teóricos o de 
criterios empíricos. Las alternativas resultantes de criterios teóricos van a ser tantas 
cuantas la teoría requiera, asignando los pesos según indicaciones que se desprenden de 
la conceptualización teórica. En el caso de asignación de alternativas según criterios 
empíricos, es posible discriminar, por ejemplo en los extremos de la distribución, según 
la distribución real de la población que se está estudiando. Tal puede ser el caso en 
algunas investigaciones que incluyen muestras representativas de la población y donde 
se hace necesario (en educación, por ejemplo) discriminar en los niveles bajos, por 
ejemplo: 


Sin escolaridad ................................. 0 
Hasta 2° grado de primarla ............. 1 
Hasta 4° grado de primarla ............. 

Más de 4” grado pero no completa .. 3 
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Primaria completa ............................ 4 


Secundaria incompleta ..................... 5 
Secundaria completa ......................... 6 
Universitaria completa o incompleta 7 


Es posible utilizar asimismo los valores parámetros para determinar los cortes. Por 
ejemplo, en ingreso, es posible tomar el promedio de la población y las desviaciones 
estándar para determinar diferentes cortes. Hay numerosas alternativas que dependerán 
del tipo de investigación que se está realizando, el tipo de variable, los conocimientos en 
el área, etcétera. 

Los índices ponderados. Si por razones teóricas deseamos que los indicadores tengan 
pesos diferenciales, la asignación de pesos a las alternativas de respuesta en los 
indicadores que se desea que tengan valores mayores puede realizarse de la siguiente 
forma. Supóngase que el índice total esté compuesto de tres indicadores que tengan la 
misma cantidad de alternativas de respuesta, pero donde queremos adjudicar al indicador 
A un peso 2 (ponderación), mientras que los indicadores В у С van a tener un peso 1. La 
situación en cuanto al peso definitivo será entonces: 


Valores Vaiores 

Indicadores originales Ропаетасідп finales 
A 0 1 2 2 2 2 0 2 4 
В 0 1 2 1 1 1 0 1 2 
C 0 1 2 1 1 1 0 1 2 


Como puede observarse, la adjudicación de pesos se hace para cada valor original, lo 
que permite al investigador realizar una ponderación, si así lo desea, no sobre todos los 
valores originales, sino sobre alguna(s) alternativa(s) de respuesta en particular. Por 
ejemplo: 


Valores Valor 
Indicador originales Ponderación final 
D o 1 2 і 1 3 0 l 6 


Existen, por supuesto, otras alternativas de ponderación, distintas de la multiplicación 
simple, o de la suma, pudiéndose realizar algún otro tipo de operación matemática. 

Cómo reducir un índice. Muchas veces los valores o el puntaje total de un índice 
pueden ser de tal amplitud que dificulten la tarea del análisis (por ejemplo, en casos de 
tabulaciones cruzadas); en tal caso el investigador pudiera estar interesado en reducir los 
valores de índice a tres o cuatro categorías, por ejemplo: alto; medio-alto; medio, y bajo. 
Dónde hay que realizar los cortes dependerá nuevamente de consideraciones teóricas, о 
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de criterios empíricos о de una combinación de ambos. Si es posible suponer que la 
variable que representa el índice es continua, es posible realizar los cortes de manera tal 
que se puedan garantizar suficientes casos en cada una de las celdas de la matriz de datos 
con las que se va a realizar el análisis. O es posible seguir los “cortes naturales” de la 
distribución de la variable, cuando se tienen las distribuciones empíricas. Supóngase la 
siguiente distribución de los puntajes de un índice de religiosidad: 


Puntajes Frecuencias Puntajes Frecuencias 
0 2 12 14 
l 3 13 6 
2 3 14 12 
3 7 15 12 
4 6 16 12 
5 10 17 8 
6 8 18 8 
7 10 19 7 
8 9 20 4 
9 G 21 4 

10 11 
П 13 Total de casos 175 


Si el investigador desea reducir, digamos, a 4 categorías la variable, existen varias 
posibilidades: es posible tomar los valores de índice, independientemente de las 
frecuencias en cada uno de ellos, y realizar los cortes, digamos, en las siguientes partes: 


Bajo: de 0а 5 
Medio: de ба 10 
Medio-Alto: de 11 a 15 
Alto: de 16 a 21 


En cuyo caso la distribución de frecuencia en cada una de las categorías sería ahora: 


ТТР 31 
Ма о as 44 
Medio-Alto 57 
AID cg 43 


Una alternativa distinta sería seguir los “cortes naturales” de la distribución, 
proponiendo los siguientes cortes: 


Valor Puntajes Frecuencia 
Bajo Оа 4 21 
Medio-Bajo Sa Y 43 
Medio 10 a 12 38 
Medio-Alto 13 a 16 42 
Alto 17а 21 31 
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La utilización de puntajes еп un indicador, para otro indicador 
en el que no se tiene respuesta 


Sucede frecuentemente que algunos de los indicadores no tienen respuesta, porque el 
sujeto no ha respondido a la pregunta o porque el entrevistador no ha registrado la 
respuesta o algo semejante. Supóngase que tenemos datos para la educación y la 
ocupación del sujeto, pero no hay respuesta para su ingreso. Queremos construir un 
índice de status en base a los tres indicadores y no queremos perder un caso. Es posible, 
asumiendo que existe intercorrelación entre los indicadores, utilizar las respuestas del 
sujeto en educación y ocupación para estimar su valor en ingreso. Los métodos más 
refinados incluirían regresiones para poder estimar el valor. Aquí señalaremos 
procedimientos algo más arbitrarios, y más inexactos. 

Si el sujeto tiene un puntaje 2 en educación y 2 en ocupación, y si las variables están 
intercorrelacionadas, puede asumirse que el puntaje total será de 6 (es decir, asumimos 
que tendrá un valor 2 en ingreso). Para el caso de mayor número de indicadores y donde 
éstos se distribuyen en forma menos uniforme, es posible calcular valores promedios y 
adjudicarlos como el valor correspondiente a la variable en la que no se dispone del dato. 

Cuando se calculan intercorrelaciones entre indicadores y no queremos perder casos, 
también es posible adjudicarle al sujeto los valores promedio de su grupo. Estas 
situaciones deben evitarse cuando la cantidad de casos sin datos supera un 10% de la 
muestra. 

Ventajas y desventajas. Los índices pueden construirse en base a datos primarios o 
datos secundarios, presentando las siguientes ventajas: a) son fáciles de construir, b) las 
operaciones matemáticas son elementales, c) reflejan cambios importantes en las 
opiniones de sujetos, d) permiten evaluar mejor la situación, en la medida en que un solo 
indicador puede llevar a errores de diagnóstico. 

Las principales desventajas: a) representan solamente una ordenación de los sujetos, 
Б) no reflejan cambios pequeños de opinión, actitud o posición, ya que pautas distintas 
en conceptos multidimensionales pueden recibir puntajes similares. 

A pesar de estas desventajas los índices son una herramienta útil para la 
investigación, especialmente cuando no se cuenta con los recursos para intentar 
mediciones más sofisticadas. 


APÉNDICE 


Consideramos conveniente presentar algunos ejemplos de taxonomías en tres disciplinas 
(botánica, psicología y sociología), por la utilidad que puedan tener con fines de 
orientación del lector con estas áreas. 

La taxonomía en botánica es presentada a un lector que seguramente está 
familiarizado con los términos debido a sus estudios en la escuela media, y su propósito 
es facilitar la comprensión de la parte formal de las taxonomías en disciplinas como la 
psicología y la sociología, donde no existe aceptación universal de las propuestas. El 
lector notará que, si bien la taxonomía presentada como ejemplo para la psicopatología 
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es relativamente completa, existen problemas en la separación tanto en las 
delimitaciones de normalidad y anormalidad como en los diferentes síndromes que 
constituyen una enfermedad en particular. Esto es debido tanto al carácter dinámico de la 
enfermedad cuanto al estado teórico actual de la psicología. Lo importante a distinguir 
aquí, bien a nivel de la taxonomía psicológica, bien de la sociológica, es que no se 
atribuye en la taxonomía la explicación de por qué se da este tipo de síntoma o síndrome 


y no otro. Las teorías psicológicas sobre la enfermedad son abundantes, igual que las 


teorías en sociología. !* 


I) Lo que se conoce como botánica sistemática es un ejemplo excelente de taxonomía. 
Se trata de ordenar los vegetales agrupándolos en categorías que incluyen no solamente 
las plantas que existen en la actualidad, sino que también llega a incluir vegetales 
desarrollados en otras épocas. Las especies vegetales son designadas con nombres 
precisos e invariables que permiten la comunicación entre botánicos de todo el mundo. 
La taxonomía que presentamos es la de Linneo (1707-1778). Antes de Linneo, las 
clasificaciones de las plantas estaban fundadas en criterios prácticos o empíricos, poco 
sistematizados y bastante confusos, en los que se entremezclaban anécdotas, opiniones 
personales, antropocentrismos, etc. Linneo propone un sistema clasificatorio coherente, 
según la disposición de los órganos sexuales de las plantas, criterio que va a permitir 
clasificar cualquier planta en términos de familia, género y especie. 

Para la botánica contemporánea, la clasificación de Linneo resulta algo simple, 
existiendo taxonomías más complejas basadas en características fisiológicas y 
morfológicas de las plantas, en las que éstas se ordenan, por ejemplo, según la división 
del trabajo fisiológico (sistemas de Braum, de Eichler, de Wettstein, sistema natural de 
Engler, etcétera). 
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Сулрво 1. Taxonomía de Linneo: sistema sexual para la clasificación de las plantas 


2 2 (Diandria) 
ta е 3 (Triandria) 
4 (Vetrandria) 
a 5 (Pentandria) 
12 o menos 6 (Hexandria) 
estambres 7 (Heptandria) 
| 3 (Octandria) 
Qe > т 9 (Enneandria 
Estambres 4 10” ” 10 керне луч i 
iguales | 2 ~ У 11 (Dodecandria) 


Estambres ) | Маз de 12 j Unidos al caliz 12 (Icosandria) 
libres | | estambres ' al receptác. 13 (Polyandria) 


| Estambres { Dos o más largos ......... > 14 (Didynamia) 
[== | desiguales 1 Cuatro más e сузек» р 15 (Tetradynamia) 


| 1 estam. Clase 1 (Monarndria) 
Ss G " 


hermafroditas 
IA. ARNES а" 16 (Monadelphia) 
: Р ЖИ ДОВ Шасеб cara а” 17 (Diadelphia) 
| Estambres ТАНЕ ПЕНУ ннан еа ” 18 (Polyadelphia) 
| unidos POr Jas айал. UNE 4, 19 (Syngenesia) 
APIO E O e е 20 (Gynandria) 


Phanerogamia 
(plantas con 
flores) 

| Flores uni- { Mogola nas ашал алил SETS 21 (Monoecia) 
| sexuales E A A PEER aa ЗЕ а 22 (Dioecia) 


| riores PORLAMAR AS NI а pes 23 (Polygamia) 


EXPPLORAMÍA GENRE SAA STATE ATA EAS ES КИЕЗ 24 (Cryptogamia) 
(plantas sin Órganos sexuales visibles) 


FUENTE: М. Ruiz O., D. Nieto R. e Ignacio Lario R.: Tratado elemental de botánica; Porrúa, México, 1950. 


Las clasificaciones de la biología están montadas según principios lógicos similares. 
El sistema sexual o la taxonomía de Linneo aparece resumida en el cuadro 1. 


П) Taxonomía еп las ciencias sociales. Las taxonomías en las ciencias sociales, 
contrariamente a las existentes en las ciencias físicas y biológicas, no llegan a alcanzar ni 
el grado de completitud de aquéllas, ni tampoco niveles de aceptación universal. 

Es quizá en psicología donde se ofrecen las taxonomías más completas, aunque 
existen distintos desacuerdos en cuanto a algunos supuestos básicos. Por ello las 
taxonomías en existencia se formulan según distintos modelos conceptuales. Las 
taxonomías en psicopatología, por ejemplo, se organizan por lo común alrededor de la 
dicotomía médica salud-enfermedad, de donde se establecen criterios y clasificaciones 
basados en la presencia de ciertos tipos de conducta, llamados síntomas, agrupados en 
síndromes que conjugan determinados tipos de desorden psicológico. 

Los criterios para la agrupación de síndromes están basados en diagnósticos 
psiquiátricos, desajustes sociales, inventarios psicológicos objetivos, infelicidad 
subjetiva, presencia en hospitales mentales, etcétera. 

Los criterios de normalidad y anormalidad a partir de los cuales se establecen las 
categorías y clasificaciones varían, por lo general, en tres tipos: ! i) la normalidad como 
un concepto estadístico (la normalidad como las tendencias más frecuentes en la 
población); ii) la normalidad como un concepto ideal de salud mental, y iii) la 
anormalidad como la presencia de ciertos tipos de conducta que llevan al sujeto a la 
miseria personal o a la incapacidad para el manejo de sus propios asuntos. La 
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clasificación о taxonomía que vamos a presentar se basa principalmente en una serie de 
síntomas agrupados en síndromes, señalando para cada uno de los casos indicadores en 
las áreas somática, afectiva, cognitiva y motora. 


I) Normalidad. La idea de salud mental о de normalidad, de Јаһода,20 entremezcla 
conceptos de salud mental como estado ideal, así como la presencia de ciertos atributos 
positivos; los criterios son: i) auto-comprensión (selfinsight), esto es, predominancia de 
lo consciente sobre lo inconsciente; ii) balance de fuerzas psíquicas; ій) auto- 
actualización (self-actualization); iv) resistencia a las tensiones (stress); v) autonomía; 
vi) competencia, y vii) percepción de la realidad. 


11) El dominio de la psicopatología es agrupado tradicionalmente en cuatro grandes 


21 neurosis, psicosis, trastornos psicosomáticos y trastornos de la conducta. 


áreas: 


Солрко 2. Taxonomía en psicología-psicopatología 


A) Normalidad: salud mental y presencia de atributos positivos. 


b) 
1) Neurosis 4 с) 
! d) 


L e) 
aj 
2) Psicosis 4 
Lo 
B) Anormalidad 


(psicopato- 
logía). 


Reacciones de ansiedad y fobias 
Histeria 

Reacciones obsesivo-compulsivas 
Reacciones de depresión 

Fatiga — hipocondriasis 


j i) manía 
ii) depresión 
( i) Simple 
a я ii) Hebefrenia 
Esquizofrenia + iij) Catatónica 
іо) Paranoide 


Afectivas 


10, 


( Psicopatía 
b 1) Drogas 


homosexualidad 
її) sadismo-masoquismo 
їй) 

i ї0) 


l ii) Alcoholismo, etc. 
3) Trastornos en la conducta 


voyeurismo 
fetichismo 
0) exhibicionismo 
travestismo, etc. 


\ с) Desviaciones sexuales 


| 
| [5 Úlcera péptica 
| b) Neurodermatosis 
с) Hipertensión esencial 
d) Asma bronquial, etc. 


| 4) Trastornos psicosomáticos 


A) Las neurosis comprenden una serie de síntomas, que no constituyen una clara 
ruptura con la realidad, que representan cierta permanencia en el individuo o que 
concurren periódicamente sobre lapsos extendidos de tiempo. Buss incluye la siguiente 
lista de síntomas neuróticos que hacen que el individuo tienda a ser sobreinhibido, 
ansioso о sobrepreocupado con culpa (guilt-riden); esas tendencias obstruyen la acción 
directa en la resolución de los problemas en la vida cotidiana; consecuentemente, la 
persona neurótica tiende a enfrentar la necesidad de elección con vacilación, la necesidad 
de dirección con extravío, y la necesidad de acción enérgica con timidez. i) Excesivo 
olvido, pensamientos obsesivos y rituales compulsivos —1ntentos autoderrotantes (self- 
defeating) para hacer frente a situaciones que producen miedo—. ii) Depresión y fatiga 
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—residuos psicológicos de tensiones prolongadas—. 

Tradicionalmente los síntomas neuróticos han sido agrupados en 5 clases de 
síndromes: 

a) Reacción de ansiedad y fobias. Caracterizada por excesivo miedo, cuyos estímulos 
son desconocidos en el caso de los primeros y especificos en las fobias. Los sintomas de 
free-floating ansiedad se agrupan en cuatro sistemas de reacciones: 

1) Somáticos: centelleos, sudor, resequedad en la boca, opresión en el pecho, 
taquicardia, incremento en la presión sanguínea, dolores de cabeza, sensación de 
debilidad, trastornos intestinales, etcétera. 

2) Afectivos: agitación, pánico, depresión, irritabilidad. 

3) Cognitivos: preocupación, pesadillas, temor, distracción, olvido. 

4) Motores: tensión muscular, temblores, falta de coordinación, “congelamiento”, 
sobresalto. 

Las fobias más comunes son hacia: animales, multitudes, gérmenes, oscuridad, 
venenos, lugares elevados, tormentas, lugares cerrados, etcétera. 

b) Histeria. Incluye una gran variedad de síntomas que superficialmente guardan 
parecido con algunas enfermedades orgánicas, pero en los cuales no existen bases 
orgánicas. Los síntomas de la histeria (aunque el histérico individual presenta 
usualmente síntomas en una o dos esferas), según los 4 sistemas de reacciones 
mencionados más arriba, son: 

1) Somáticos: dolor, debilidad, enfermedades pseudoorgánicas, desmayos. 

2) Afectivos: indiferencia. 

3) Cognitivos: pérdida de visión, pérdida de sentido del oído, pérdida del sentido del 
tacto, pérdida de memoria, sonambulismo. 

4) Motores: pérdida del habla, de la locomoción, tics, calambres musculares, ataques. 

c) Reacciones obsesivas-compulsivas. La obsesión y la compulsión tienden a 
concurrir en el mismo paciente, existiendo desacuerdo en cuál de las dos tiende a ser más 
predominante; de ahí que se usen a veces los términos neurosis obsesiva о neurosis 
compulsiva. La obsesión es una preocupación excesiva por ciertos temas, con la 
exclusión de cualquier otro. La sintomatología tiende a darse en dos áreas: 1) dudas 
obsesivas, que colocan al individuo en un estado perenne de indecisión; о 2) 
pensamientos obsesivos, que involucran acciones o tentaciones prohibitivas, de tipo 
agresivo o sexual; estos impulsos son sentidos como exteriores, con sensación 
concomitante de horror y repulsión por parte del individuo obsesivo. 

Las compulsiones son secuencias de conducta que impelen al individuo a llevarlas a 
cabo; de no realizarse el ritual, se genera ansiedad. Las compulsiones más comunes son 
las de repetición y simetría y exagerada atención al detalle. En las primeras el individuo 
repite la secuencia de conducta una y otra vez. En las compulsiones simétricas, la última 
parte de la secuencia de conducta balancea la primera parte. 

d) Depresión neurótica. Cae dentro del tipo de síndromes productos de residuos 
psicológicos de tensiones. En este sentido la depresión neurótica puede ser vista como 
una reacción a la pérdida o al fracaso: fracaso en la resolución de problemas importantes 
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de la vida cotidiana; fracaso para enfrentar el conflicto, o pérdida de una relación 
importante. Los síntomas se dan fundamentalmente en las áreas afectivas y motoras: 

1) Afectivos: melancolía, pesimismo, apatía, autodepresión. 

2) Motores: lentitud en el habla; lentitud de movimiento. 

e) Fatiga hipocondriasis. Combina dos clases de síntomas que a veces se mantienen 
separados: cansancio y sobrepreocupación con la salud. Los síntomas tienden a concurrir 
en dos esferas: la afectiva y la somática: 

1) Somáticos: dolores y padecimientos; falta de energía. 

2) Afectivos: aburrimiento, irritabilidad. 


B) Las psicosis comportan síntomas más serios y desviados que los neuróticos: 1) 
Alucinaciones: perturbaciones en percibir la realidad. ii) Delusiones: perturbaciones en 
interpretar la realidad. iii) Pérdida de la capacidad de asociación, habla fragmentada e 
incoherente: perturbaciones en el pensamiento. iv) Melancolía prolongada o júbilo: 
perturbaciones en el humor. v) Aislamiento y retiro de otras personas: perturbaciones en 
la interacción personal. 

Siguiendo a Buss (op. cit.), clasificamos los síntomas de psicosis en dos grandes 
grupos: psicosis afectivas y esquizofrenia. 

a) Las psicosis afectivas incluyen los síntomas en los cuales el humor o estado de 
ánimo es predominante. La división en síndromes se hace comúnmente entre manía y 
depresión, que con frecuencia se dan como alternantes en el mismo paciente. 

1) Manías. Los síntomas se dan principalmente en las esferas motoras y afectivas. Los 
niveles de actividad varían desde el exceso de energía en júbilo al retardo motor en la 
melancolía: i) síntomas afectivos: humor jovial que se expande a toda la esfera de 
actividades, superoptimismo, euforia, grandiosidad, alta autoestima у Баја 
autocomprensión (self“insight), pomposidad, alto sentido gregario, excesos en la 
sociabilidad que lleva a la intrusión y a la molestia. ii) Síntomas motores: movimientos 
físicos excesivos, euforia motora, falta de inhibición y control, impulsividad e 
impetuosidad, excitamiento y excitabilidad, a veces conducta violenta (agresiva о 
sexual). її) Cognitivos: atención intensa pero breve, asociaciones tangenciales leves, 
presencia de algunas ideas ilógicas, rapidez en el habla, fantasías egocéntricas, 
delusiones de grandeza o de persecución leves y libres de hostilidad. 

2) Depresión. Es más compleja que la manía. A veces se clasifica en subtipos: 
simples, agitadas, involucional y post-partum. Los síntomas más importantes se dan en 
las esferas afectiva y motora, representando la contraparte de los que se manifiestan en la 
manía: i) afectivos: sentimientos de culpa, remordimientos, pesar, aburrimiento y 
desinterés, falta de esperanza, pesimismo, desalentamiento. ii) Motores. letargia, 
indolencia, falta de iniciativa, autoagresión que a veces lleva al suicidio. En los 
depresivos agitados, en los que se dan altos contenidos de ansiedad, hay algún tipo de 
actividad. її) Somáticos: bajo tono digestivo y en general de los procesos 
gastrointestinales, pérdida de apetito y de peso, insomnio; constipaciones, sentimiento de 
presiones en la cabeza y pecho. iv) Cognitivos: depersonalización, inhabilidad para 
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sentir, amar, para experimentar placer. Delusiones de carácter leve y circunscritas a tres 
áreas: culpa (reclamo de responsabilidad sobre todo accidente, pérdidas, daños, etc.); 
nihilismo (el paciente o el mundo están en un curso de total destrucción del que no hay 
escape) y procesos corporales (desintegración del cuerpo). 

Б) Esquizofrenia. Tradicionalmente se delinean 4 tipos de esquizofrenia: 

1) Esquizofrenia simple: solapado alejamiento en la interacción social, pobreza de 
pensamiento (sin alucinaciones o delusiones), profunda apatía y falta de respuesta 
emocional. 

2) Hebefrenia: conducta infantil y necia; deterioro en los procesos del pensamiento; 
habla incoherente, neologismos, asociaciones extrañas; alucinaciones, y a veces 
delusiones. 

3) Catatónica: extremos en el nivel motor de actividad (rigidez o excitación), 
alucinaciones. 

4) Paranoide: incluye solamente síntomas cognitivos; presencia de delusiones y 
alucinaciones. 

Los síntomas más importantes de la esquizofrenia se producen en la esfera cognitiva, 
particularmente como un resultado de alteraciones en la percepción de estímulos; en 
general conducen a la depersonalización, y son: perturbaciones en el lenguaje y en el 
pensamiento, perturbaciones en el sentido de sí mismo (particularmente en la imagen 
corporal), autismo, alucinaciones y delusiones. 

En el curso de la esquizofrenia es posible delinear 4 estadios sucesivos. Primer 
estadio, ansiedad (comienza con pánico ante los síntomas, seguido por intuición de tipo 
psicótico y proliferación de nuevos síntomas); el segundo estadio es llamado avanzado 
(el paciente acepta los desórdenes y deviene apatético, deterioro en el área afectiva y 
retiro de las áreas de interacción social); en el tercer estadio, o preterminal, los síntomas 
se agravan al punto que es difícil distinguir distintos tipos de esquizofrenia; en el cuarto 
estadio, o terminal, el paciente aparece dominado por hábitos primitivos. Generalmente 
los pacientes pueden no seguir el curso completo de la enfermedad, sino permanecer ya 
en el segundo estadio, o alternando periodos esquizofrénicos con periodos relativamente 
libres de síntomas. 


C) Desórdenes psicosomáticos. Presentan un grupo de enfermedades que involucran 
trastornos orgánicos que están indistintamente asociados a perturbaciones emocionales y 
que involucran por lo general estructuras innervadas por el sistema nervioso autónomo: 
estómago (úlceras pépticas), piel (neurodermatosis), arterial-periféricas (hipertensión 
esencial), bronquios (asma bronquial). 


D) Trastornos de la conducta. Se refiere de ordinario a trastornos no tolerados por la 
sociedad. Por lo general se consideran tres clases: 

a) Рѕісорайаѕ. Se dan dos clases de síntomas: la conducta asocial o antisocial 
(irresponsabilidad, amoralidad), y la inmadurez o falta de socialización (ausencia de 
culpa o vergüenza). Sintomatología: 
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1) Conducta orientada hacia las conmociones y desprecio por las convenciones (trata 
a las personas como objetos). 

2) Inhabilidad para controlar impulsos o posponer gratificaciones. 

3) Rechazo de la autoridad y la disciplina. 

4) Juicio pobre sobre conductas, pero buenos juicios acerca de situaciones abstractas. 

3) Falla en alterar o modificar una conducta que ha sido castigada (falta de 
sentimiento de culpa). 

6) Mentiroso patológico. 

7) Conducta asocial y antisocial. 

Características de personalidad: i) En las relaciones personales, incapacidad para el 
amor o la amistad intensa, centrado en sí mismo, egoísta, falto de empatía, usa a las 
personas como objeto. ii) Adicciones: alcoholismo, drogas, etc. iii) Desviaciones 
sexuales: incluye homosexualidad; relación sexual con animales; sadismo-masoquismo; 
voyeurismo y fetichismo; exhibicionismo: travestismo. 


En sociología las taxonomías son menos precisas que en psicología y no existe un 
sistema universal para el diagnóstico sociológico aceptado.?? Presentamos aquí la 
tipología de Gino Germani,” en la que el autor, aclarando que se trata de una extrema 
simplificación, señala que los dos tipos de sociedades representan los extremos de un 
continuo pluridimensional. Los dos tipos de sociedades se describen en función de las 
modificaciones que se producen en tres principios básicos de la estructura social: 7) El 
tipo de acción social. 2) La actitud hacia el cambio. 3) El grado de especialización de las 
instituciones. 
El proceso de transición se caracteriza como un proceso de secularización. 
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Солрко 3. Dos tipos ideales contrapuestos: sociedad tradicional y sociedad industrial. 


Sectores 


Sociedad tradicional 


Sociedad industrial 


Modelo “Liberal” Transformaciones recientes 


Principios básicos de la 
estructura social 


Tipo de relaciones sociales 
características 


Tecnología 
Energía: 


Procedimientos de produc- 
ción 
Actitudes: 


Economía 


Rasgos generales 


Principios y hechos que ri- 
gen la organización eco- 
nómica 


Formas de repartición del 
excedente económico 


Acción prescriptiva, institucionali- 
zación de la tradición, institucio- 
nes indiferenciadas 


Adscripción, particularismo, carácter 
difuso, carácter afectivo 


Utensilios manuales 
Energía humana y animal 


“Artesanal” (unidad por unidad) 
Procedimientos tradicionales 
Se desalienta el cambio 


“Economía de subsistencia” 

Producción para satisfacer necesida- 
des concretas, de individuos o 
grupos concretos, en un nivel tra- 
dicional 


Economía “natural” 


Carácter estático de la economía 


Unidades productoras 
autosuficientes 

La esfera de lo económico indife- 
renciada del sistema social 

División del trabajo tradicional. Se- 
gún status adscriptos, por sexo y 
edad 

El trabajador posee los instrumen- 
tos de producción 


Poca importancia del capital fijo 
(maquinaria, instalaciones, edifi- 
cios, etc.) 

—Reciprocidad 
—Redistribución 
—Autoabastecimiento 
—Economía doméstica 


No estratificadas: 
repartición más igualitaria 


Estratificadas: 
repartición desigual 
Sociedades “feudales” 
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Acción electiva, institucionalización del cambio, especialización 
creciente de las instituciones 


Desempeño, universalismo, especificidad, neutralidad afectiva 


Máquinas 
Energía proporcionada por 
motores “primarios” 
Energía proporcionada por 
motores “secundarios”. 
Energía atómica 
“Producción en serie”. 
“Cinta de montaje” 
“Automatización” 
Procedimientos “racionales”, búsqueda del cambio 


Economía de producción para el cambio. 
Producción para satisfacer una “demanda”, un público “com- 
prador” abstracto 

Economía de mercado 
Economía de mercado y nuevas 
formas de regulación 

Hincapié sobre la producción 
Hincapié sobre el consumo. 
Economía monetaria 


Carácter dinámico de la economía 
Interdependencia creciente, crisis económicas 


La esfera de lo económico se especializa. Funcionalización y 
especialización de las actividades 

División del trabajo funcional según criterios racionales. Bús- 
queda de la eficacia. Importancia de la profesión 


El trabajador no posee los instrumentos de producción 


Creciente importancia del capital fijo 


Principio hedónico: mínimo esfuerzo 

Racionalización creciente: adecuación de medios a fines 

Fin “económico”, “rentabilidad”, diferenciación de otros fi- 
nes “no económicos” 

Comercialización de los factores de la producción 

Especialización e interdependencia creciente (entre indivi- 
duos, empresas, países) 


Ganancias: “lucro racional” 
Libre competencia 
Empresas individuales 
Trabajo “libre” 
Precios regulados por el mercado 
No intervención del Estado 
más desigual menos desigual 
Limitaciones al principio de la ganancia; in- 
cluso del fin económico 


Sectores 


Motivaciones y actitudes 
hacia la economía y el 
trabajo. 


Propiedad típica 


Unidades económicas típi- 
cas 


Actividades económicas tí- 
picas 


Organización social 


Tipo de status 


Солрко 3. (Continuación) 


Sociedad tradicional 


No estratificadas: 

faltan motivaciones especiales para 
la actividad económica 

Producir bienes de consumo, con- 
cretos, hasta cubrir el nivel de 
subsistencia fijado por la tradi- 
ción. Trabajo directamente rela- 
cionado con la necesidad 

Principio de la subsistencia 

No hay espíritu de competición en 

lo económico 


Estratificadas: 

En general: mismos principios 

Clases superiores: 

lo económico considerado inferior: 
sólo consumen (no producen, 
debiendo los inferiores propor- 
cionarles lo debido tradicional- 
mente) 


Clases inferiores: 

artesanos: “instinto artesanal”; sier- 
vos; aceptación pasiva, compul- 
sión 


Formas concretas de propiedad co- 
munal y personal 


“primitivas” 
varia 
“feudales” 
tierra 


Son las mismas que corresponden 
a la organización social: 

Familia extensa 

Taller artesanal y actividad agrícola 


Actividades primarias 


Predominio de lo primario 
Grupo de parentesco 
Grupo de edad 
Grupo de sexo 
Grupo local 
En las sociedades estratificadas ad- 
quieren importancia: 
Castas, 
estamentos 
Status definidos por la edad, el 
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Sociedad industrial 


Modelo “Liberal” Transformaciones recientes 


Grandes empresas. Empresas directoriales, anó- 
nimas, mixtas, nacionalizadas 
Trabajo organizado. Sindicatos. Contratación 
colectiva 
Precios políticos 
Intervención, regulación, planificación, propie- 
dad estatal 
Clases superiores 
(burguesía): 
Homo economicus 
Principio hedónico. Lucro: por medio de actividad produc- 
tiva racional organizada: rentabilidad 
“Ascesis capitalista” 
Éxito económico identificado con éxito en la vida (cf. signo 
de salvación en el calvinismo) 
“Espíritu de empresa” 
Expansión, innovación 


Clases inferiores: 
reflejo de las motivaciones anteriores, mezcladas con restos 
de las actitudes precapitalistas 
Incentivación por la ganancia 
Deseo de ascender. Competición 
Necesidad 
Deber, tradición 


Clases superiores: 

Aparecen nuevas motivaciones; disminuye 
deseo de “lucro racional”. Competición 
por el status; poder y prestigio dentro de 
la empresa directorial; disminuye ascesis 

Clases inferiores: 


Competición por el status; deseo de segu- 
ridad 
Formas más abstractas de propiedad 
La fábrica. Propiedad personal de capital mobiliario 
Propiedad de títulos representativos de capital o 
créditos. Participación en propiedad colectiva 
Empresa individual. Soc. de personas 
Empresa anónima. Sociedad de capital. Empresa 
directorial. Separación de la propiedad y del 
control я 
privada 
Actividades secundarias 


mixta pública 


Actividades terciarias 


Predominio de lo secundario 
clase social 
ocupación 
nacionalidad 
Multiplicidad de grupos “secundarios” 
Status definido por la clase, la ocupación, la per- 
tenencia a grupos secundarios 


Sectores 


CUADRO 3. (Continuación) 


Sociedad tradicional 


Sociedad industrial 


Modelo “Liberal” Transformaciones recientes 


Grupos primarios familia 


Grupo local 


Grupos secundarios 


Religión 


Estratificación social 


Ideologías relativas a la es- 
tratificación social 


Aspectos demográficos 


sexo, el parentesco, la casta, el es- 
tamento 
Status adscriptos 
importantes 
Familia extensa u otras formas si- 
milares 
Funciones: biológicas, económicas 
(producción y consumo), educa- 
cionales; recreativas, religiosas, et- 
cétera 
Posición central del grupo de 
parentesco en la sociedad 
Aldea-vecindario 


Poco importantes o inexistentes 


Importante 
Penetra en toda la vida social 


No estratificadas 
No se distinguen claramente capas 
sociales superpuestas 
Estratificadas “feudales” 


Aristocracia (terratenientes no- 
bles; militares, sacerdotes) 


Clases inferiores: 

Hombres libres (artesanos, mer- 
caderes, etc.); siervos, ligados a 
la tierra, etcétera 

Cerradas 
Estáticas 
Poca o nula movilidad social 
Adscripción 
Sociedades estratificadas: 

A cada uno según su status, según 

el lugar que le tocó en la vida 


Se desalienta la movilidad. Se es- 
timula la permanencia en la 
misma posición 


Poca población 
“Alto potencial demográfico” 


Alta natalidad 
Alta mortalidad 
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Status adquiridos 
Menos importantes 
Familia nuclear 
Conyugal, aislada, inestable 
Funciones: biológicas; socialización del niño; 
ajuste emocional del adulto; económicas; 
consumo únicamente 


Aldea, vecindario 
El grupo de parentesco menos importante. 


El suburbio 
Muy importantes 
Ocupaciones. 
Grupos educacionales 
Recreativos. 
Ideológicos 


De intereses 
Asociaciones voluntarias 
Menos importante 
Toca una esfera especializada: la religión como 
aspecto separado de la vida 
Laicización 
Burguesía: propietarios de la industria y del comercio; pro- 
fesiones liberales 
Obreros industriales y otros rurales: propietarios arrendata- 
rios, dependientes sin tierra 


Disminuyen los propietarios de industria y 
de comercio 
Aumentan dirigentes de empresas, técnicos; 
Empleados 
Obreros industriales (varía la composición). 
Disminuyen las clases rurales: propietarios y 
dependientes 
Clases abiertas. En teoria: absoluta movilidad social. En 
práctica: diferentes grados de movilidad social 


Adquisición a través de la lucha competitiva 
Igualdad de oportunidad 
Compulsión a ascender socialmente 
No ascenso = fracaso 
Posición = fruto del esfuerzo personal 
Ascenso a través del enriquecimiento por medio 
del éxito en los negocios propios; o llegando 
a transformarse de “dependiente” (obrero, por 
ejemplo) en “por su propia cuenta”, etcétera 
Aparece la motivación a ascender dentro del 
sistema de posiciones de la gran empresa 
directorial pública o privada. Motivos del 
prestigio y el poder 
Extraordinario aumento de población 
“Transición demográfica” 
“Bajo potencial demográfico” 
Alta natalidad (bajando) 
Mortalidad (bajando) 
Tasas diferenciales 
Clases med.: baja natalidad 
Clases pop.: alta natalidad 
Disminuyen las diferencias demográfi- 
cas entre clases 


Солро 3. (Continuación) 


л 


Sectores 


Sociedad tradicional 


Sociedad industrial 


Modelo “Liberal” Transformaciones recientes 


Centro típico 


Movilidad ecológica 


Tipos de autoridad 
y control 


Caracteres generales de la 
sociedad, la cultura y la 
personalidad 


Grado de homogeneidad: 


Grado de cambio: 


Grado de comunicación: 


Accesibilidad social y eco- 
lógica 

Formas de sociabilidad 

Relación con el grupo: 


Grado de libertad (psico- 
social) 


Tipo de integración 


Sistema de valores. Conte- 
nido 


Forma de aplicación de los 
valores 


Población esencialmente rural 


La aldea 
El vecindario 


Baja o ninguna 


Tradicional 
(y formas carismáticas) 
Costumbre 


“Sociedad sagrada aislada” 

Todas las funciones tienden a per- 
manecer indiferenciadas, dentro 
del sistema social (familia, econo- 
mía, religión) 

Alta homogeneidad 

Repugnancia a lo distinto. Intole- 
rancia. Etnocentrismo 


Extranjero = extraño = enemigo 


“Lo antiguo = sagrado” 
Repugnancia al cambio. Dominio 
de la tradición y sus portadores: 
los ancianos 
Poca o nula. 
Pocos contactos 


Aislamiento social y ecológico 
“Primaria” 

(el vínculo familiar) 

Individuo sumergido en el grupo 
Sentimiento de pertenencia 


Baja 


Basada en la tradición, la confor- 
midad, la estaticidad, la inmer- 
sión en el grupo. La alta homo- 
geneidad, factor de integración 


Varía: en general de carácter reli- 
gioso, trascienden al individuo y 
su vida terrenal, o al grupo como 
verdadera o superior realidad 

La tradición, la sangre, la tierra, la 
divinidad 


El sistema de valoración es único 
en cada sociedad (homogeneidad); 
se fija clara y detalladamente la 
conducta del individuo en las di- 
ferentes situaciones vitales; el in- 
dividuo no debe elegir; no debe 
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Población crecientemente urbana 
La gran ciudad 
Megalópolis 
Centralización Ligera tendencia a la descentralización 
Destrucción de la aldea 
Importancia del suburbio como centro 
“local” 
Alta, con tendencia a crecer 


Estado moderno 
Racional — burocrática 
Leyes-reglamentos 
Sociedad masificada: aparecen formas carismáti- 
cas. Conformismo 


“Sociedad secular accesible” 


Máxima especialización — diferenciación de las funciones en 
esferas separadas 
Alta heterogeneidad 
Aceptación de lo distinto: 


Tolerancia 
espíritu liberal 
cosmopolitismo 
Exaltación de lo nuevo 
Búsqueda del cambio 
Dominio de la voluntad de transformación basada en prin- 
cipios de racionalización 
Multiplicación de contactos, 


creciente comunicación, 
creciente accesibilidad social y ecológica 
“secundaria” 
(lo funcional y lo anónimo) 
Forma normal: “individuación-liberación” 
Forma patológica: Sentimiento de aislamiento. “Atomiza- 
ción” 
Sirgen problemas vinculados a la perso- 
nalidad. “Miedo a la libertad” 


Alta 


Basada en la interdependencia funcional; el reajuste autó- 
nomo y funcional de individuos “liberados”, coexistencia 
de lo heterogéneo; adaptación adecuada al cambio: elec- 
ción de valores por el individuo por medios racionales 
y por el ejercicio de su voluntad, Formas patológicas de 
integración: anomia, desintegración social 

Afirmación del individuo como ente autónomo dotado de fa- 
cultades racionales, capaz de dirigirse a sí mismo apoyán- 
dose en sus propias fuerzas. Hincapié en valores in- 
manentes al individuo y a su vida terrenal 

Afirmación de la razón, la voluntad, el cambio (el 
“progreso”), la libertad, la tolerancia 
Aparecen formas contrarias de valoración: 
“raza”, “sangre”, “nación”, resurgimientos 
religiosos o nuevas formas de religiosidad; 
el “Estado”, la “clase”; irracionalismo, et- 
cótera 

Hay multiplicidad de valores y de criterios de valoración a 
menudo en conflicto entre sí. Los individuos deben elegir 
por medio de su voluntad y razón. Las situaciones que en- 
frentan son cambiantes y pueden no responder a las expec- 
tativas: los individuos deben realizar continuos ajustes; hay 
ambigúedad y contradicción 


Cuapro 3. (Conclusión) 


Sociedad industrial 
Sectores Sociedad tradicional 


Modelo “Liberal” Transformaciones recientes 


interpretar: sus actitudes interna- Lo internalizado no deberían ser formas rígidas de compor- 


lizadas responden de manera auto- tarse, sino capacidad de adecuarse creativamente al cambio 
mática a las situaciones que se le 
presentan 

Tipo de personalidad “Tradicional” Dirigida desde adentro: “giroscopio” 


Dirigida desde afuera: “radar” 
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Ш. MUESTREO 
JORGE PADUA 


“UNIVERSO” o “población” son palabras utilizadas técnicamente para referirse al 
conjunto total de elementos que constituyen un área de interés analítico. Lo que 
constituye la población total está delimitado, pues, por problemáticas de tipo teórico: 51 
la referencia es a individuos humanos, el universo o población estará constituido por la 
población total de la humanidad; o por la población de un país, o la de un área 
determinada, etc., etc., según sea la definición del problema de investigación. 

Los elementos que constituyen a una población, por supuesto, no tienen que ser 
necesariamente individuos humanos; uno puede referirse a naciones, grupos, edificios, 
animales, objetos físicos o elementos abstractos (tales como, por ejemplo, la “población 
de verso y reverso de una moneda” o de cualquier otra distribución binomial o 
multinomial). 

Los parámetros poblacionales (o simplemente parámetros, o valores “verdaderos”) 
caracterizan las distribuciones en la población o universo; éstos pueden ser valores de 
ciertas distribuciones de variables aleatorias tales como la media aritmética o la 
desviación estándar. 

Se denomina muestra un subconjunto del conjunto total que es el universo о 
población. 

La teoría del muestreo tiene como propósito establecer los pasos o procedimientos a 
través de los cuales sea posible hacer generalizaciones sobre la población a partir de un 
subconjunto de la misma, con un grado mínimo de error. Sin embargo, como veremos 
más adelante, no toda muestra tiene como propósito “sacar conclusiones” acerca de la 
población; existen varios tipos de muestreo que se ocupan de selección de muestras para 
otros propósitos. 

Los valores muestrales son los estadísticos computados a partir de las muestras, y con 
los cuales se buscará estimar los parámetros poblacionales. 

Decíamos que no toda muestra o no toda investigación tiene como propósito obtener 
conclusiones acerca de la población. Según Galtung! una muestra debe satisfacer en 
general dos condiciones: 7) en ella debe ser posible poner a prueba hipótesis sustantivas, 
esto es, proposiciones acerca de relaciones entre variables, y 2) debe ser posible poner a 
prueba hipótesis de generalización —de la muestra al universo— sobre las proposiciones 
establecidas en la muestra. 

La primera de las condiciones hace referencia al hecho de que la muestra sea lo 
suficientemente “buena” para permitirle al investigador extraer conclusiones en cuanto a 
las relaciones entre sus variables. 
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La segunda de las condiciones tiene que ver соп la posibilidad de establecer 
generalizaciones; es decir, inferencias válidas, con un grado de incertidumbre conocido. 
Para esto es necesario que las muestras sean probabilísticas, ya que la determinación del 
grado de incertidumbre o de “confianza” que pueda atribuirse a las inferencias depende 
en sus cómputos de la teoría de las probabilidades. 

Si bien las muestras aleatorias o probabilísticas (cuando son de tamaño grande) 
tienden a cumplir las dos condiciones, existen casos en los cuales el investigador puede 
estar más interesado en la teoría sustantiva que en la generalización. Dedicamos la 
última sección a los procedimientos para selección de muestra en este tipo de 
situaciones. 

Siguiendo los propósitos de este manual, vamos a concentrarnos más en aspectos 
operacionales que en aspectos “teóricos” o “sustantivos”; es decir que no vamos a 
profundizar en la teoría estadística del muestreo ni tampoco en los problemas específicos 
que surgen en las investigaciones concretas y que tienen que ver con la relación entre la 
muestra y el tipo de hipótesis que el investigador quiere probar. Hay que señalar 
solamente que en algunas ocasiones la muestra en sí puede “desvirtuar” la investigación 
en el sentido en que los procedimientos muestrales pueden conducir a una 
desestructuración del universo; por ejemplo, cuando las unidades están conectadas por 
relaciones específicas de dominación, de interacción, de comunicación, etc. Nosotros 
vamos a tomar estos casos como un tipo especial de muestras predispuestas; es decir, 
muestras en donde la comprobación o refutación de la hipótesis pasa a ser el resultado de 
procedimientos de muestreo. 

Puesto que vamos a concentrarnos en señalar los modos operacionales para obtener 
distintos tipos de muestras y no en la teoría estadística de las distribuciones muestrales, 


recomendamos al lector interesado algunos textos importantes en esa línea.? La literatura 
en el área es abundante, y la lista señalada es solamente una mínima selección. 


DISTINTOS TIPOS DE MUESTRAS 


El problema del muestreo surge cuando la población a estudiar es demasiado numerosa 
como para implicar costos en energía y dinero insuperables. Se trata entonces de 
seleccionar a un subconjunto que minimice esos costos al mismo tiempo que no se 
produzca pérdida de precisión. 

La teoría del muestreo establece las condiciones mediante las cuales las unidades o 
las muestras son seleccionadas de manera tal que el subconjunto resultante (la muestra) 
contenga el mínimo de sesgos posibles. 

Muestras predispuestas. Son aquellas que han sido seleccionadas de manera tal que la 
comprobación o la refutación de las hipótesis pasa a ser el resultado de procedimientos 
de muestreo. Por ejemplo, una muestra predispuesta sería aquella en la cual, para 
comprobar alguna hipótesis acerca del comportamiento político de la población total de 
votantes, utilizamos solamente individuos o elementos que, a partir de su pertenencia a 
un grupo específico, presentan peculiaridades que no son típicas de la población en su 


56 


conjunto. 


Muestras 
(Todos los individuos о elementos 
tienen una probabilidad conocida de ser 


incluidos en la muestra) 


Todas las combinaciones 
tienen igual probabilidad 


de darse en la muestra 


3 
Н 
і 
$ 
| 


de darse сп la muestra 


5 
3 
: 
| 
| 


Ж бишей A башы 


1. Hacer una lista comple- 
ta del universo 

2. Asignar un número п 
cada individuo del uni- 


verso 

3,A través de una tabla 
de números aleatorios o 
procedimiento similar se- 
leccionar un número de 
individuos que van a 
constituir la muestra 


1. Hacer una lista comple- 
ta del universo 

2. Seleccionar el primer in- 
dividuo a través de un 
método aleatorio 

3, Seleccionar cada ¡-ócimo 
individuo a partir del 1° 
seleccionado (рог ejem 
plo, сайз décimo indi 
viduo) 


1. Dividir el universo en es- 
tratos internamente ho- 


mogéncos 

2. Seleccionar dentro de ca- 
da estrato los individuos 
de modo aleatorio 

3. Las fracciones de mues- 
tra, en cada estrato, son 
proporcionales 


1. Idem, proporcional 

2, Idem, proporcional 

3. Las fracciones en cada 
estrato pueden ser dis- 
tintas según las necesi- 
dades 


1, Dividir el universo en 
diversos grupos о clus- 


tera 
2. Seleccionar primero qué 
clusters deben constituir 
la muestra 
3. Dentro de cada cluster 
seleccionar los individwos 
de la muestra de modo 
aleatorio 


Entrevistar a los individuos, 
hasta un cierto número, de 
forma casual (por ejemplo, 
los que pasen por una es- 
quina) 


Seleccionar casos tipicos 
del universo según el cri- 
terio de un experto 


Cada entrevistador debe 
entrevistar una cierta cuo- 


CUADRO 1 


1. Igual probabili. 
dd de inclusión 


2, Permitir la ge 
neralización 


paridad entre las 
medidas de la 
muestra y del 
universo 

Idem que para la 
muestra simple 
al azar 


l, Idem que para 
las dos anterio: 


res 
2. Garantiza la re- 
resentatividad 
3, Elimina los erro- 
res entre estratos 


1. Idem que para 
las dos anterio- 


res 
2. Posíbilita mejor 
conocimiento de 


grupos pequeños 
en el universo 


Las que se derivan 


de no tomar a 
todo el universo 


‚ Mayor facilidad 


en obtener la 
muestra 


‚5! los estratos 


son homogéneos 
caeteris paribus, 
hace posible una 
muestra menor 
y mayor econo- 
mía 


. Ahorra dinero 


sobre todo por: 
que permito la 
concentración de 
los entrevistado- 
res ст áreas pró- 
хипаз. 


¿Ahorra tiempo 


. Exige personal 


menos entrena- 
do y de costo 


menor 


1 № provec un 
número sufi. netario 

2, Alto costo de 
tiempo 
ciales 

2. Puede haber dis- 
torsiones єп 
cuanto a la ге 
presentatividad 


1.$ hay algún ti- 
2 en 
lista cl mues- 


tico puede re- 
sultar influido 


1, Costo más alto 


ficultad para 
determinar estra- 


tos homogéneos 


1. Exige tratamien- 
tos estadisticos 
algo complejos 


2. Dificultad para 
determinar estra- 
homo; 


1. Exige tratamien- 
tos estadísticos 


muy complejos 
2. Hay pérdida de 
recisión 
3. Pérdida del ca- 
rácter alcatorio 
del muestreo 


1. Presenta serio 
obstáculo a la 


generalización 


Muestras no probabilisticas 
(No se conocen las probabilidades de 
de ser in- 


cada individuo o elemento 
cluidos en la muestra) 


ta de individuos de cada 
pra. mon] (рог ejemplo 
hombres y mujeres) 


Calcular la matriz de datos más com- 
pleja a analizar. Utilizar la fórmula: 
Sirven para probar hipótesis, tienen en 
ME ль; cuenta el análisis y las técnicas analíticas 


Proceder a llenar las casillas ya sea me- 


diante el sistema de cuotas, o por algu- 
na técnica de muestreo ificado 


Exigen conocimiento previo tanto de ca- 
racterísticas poblacionales cuanto del 
tipo de análisis que se va а utilizar, Al- 
gunas veces no es posible establecer ge- 
neralizaciones 


Muestras no predispuestas. Son aquellas cuya probabilidad de extracción es 
conocida. Hay dos muestras de este tipo: muestras cuya probabilidad de ser extraídas es 
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cero o uno (finalistas); o muestras cuya probabilidad de ser extraídas es diferente de cero 
o de uno (probabilísticas). 

El cuadro 1 sintetiza los tipos de muestra que vamos a exponer en este capítulo, los 
procedimientos básicos para su obtención y sus ventajas y desventajas. Las muestras que 
vamos a considerar son: 

A) Muestras probabilísticas: 1) Muestra simple al azar. 2) Muestra sistemática. 3) 
Muestra probabilística (proporcional y no-proporcional). 4) Muestra por conglomerados. 

B) Muestras no-probabilísticas: 1) Muestra casual. 2) Muestra intencional. 3) 
Muestra por cuotas. 

C) Muestras para probar hipótesis sustantivas. 


A) MUESTRAS PROBABILÍSTICAS 


En este tipo de muestra todos los elementos que componen el conjunto total o universo 
tienen una probabilidad conocida de ser incluidos en la muestra. Describiremos 4 tipos 
de muestras probabilísticas: /) Muestreo simple al azar. 2) Muestreo sistemático. 3) 


Muestreo estratificado. 4) Muestreo por conglomerados.” 


1) El muestreo simple al azar 


En el muestreo simple al azar, todas las muestras y todos los elementos tienen la misma 
probabilidad de ser seleccionados. Además, como mencionamos anteriormente, esa 
probabilidad es conocida y diferente de cero y de uno. 

La probabilidad para un individuo o elemento de ser extraído en la muestra resulta de 
la siguiente relación: 


1 
Р= у 
Donde: 


М = tamaño de la población 


Por ejemplo: en el sistema de lotería en México, la probabilidad de cualquier número 
para ser extraído con el premio mayor es igual a: 


1 


=-——__ = 0. 2 
50 000 а 


p 


En el caso de la probabilidad de una muestra particular de ser extraída es igual a: 
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Donde: 


N = tamaño de la población 
n = tamaño de la muestra 
! = factorial 


Es decir, la ecuación nos va a señalar la probabilidad que la combinación de n elementos 
tiene de ser seleccionada. Y esa probabilidad es la misma para cada una de las muestras 
posibles de tamaño n. En el caso de una muestra de tamaño 10, cuya población tiene un 
tamaño de 100, la probabilidad para cualquier muestra de ser extraída sería igual a: 


а 1 Е 1 
100 1 — 124 603 388 140 


101 (100 — 10)! 


El muestreo aleatorio simple es el más sencillo de todos los tipos de muestreo y, cuando 
es de tamaño grande, no solamente resulta una muestra probabilística, sino también una 
muestra por cuotas. Además, cualquiera que sea el tipo de muestreo probabilístico, en 
algún nivel de éste hay que recurrir al muestreo aleatorio simple (ver muestra 
estratificada, por ejemplo). 


¿Cómo se decide el tamaño de la muestra? 


Dijimos más arriba que a través del muestreo se obtienen reducciones en los costos, es 
decir que, mientras más pequeña sea la muestra, menores serán los costos de la 
investigación en términos de esfuerzo, dinero, etc. Ahora bien, el problema siguiente es 
que, a medida que la muestra es más pequeña, la probabilidad de error es mayor; 
entonces, las decisiones en la determinación del tamaño de la muestra se plantean de la 
siguiente manera: compatibilizar la disponibilidad de recursos (que normalmente son 
escasos) con la precisión deseada en las estimaciones.* En otros términos, seleccionar 
una muestra de tamaño tal que se logre un máximo de precisión, con un tamaño mínimo 
de muestra. 

Galtung? nos presenta una estrategia excelente que consiste en el “principio de las 
utilidades decrecientes”, es decir, aquel que resulta del siguiente razonamiento: no 
interesa tanto el tamaño exacto de la muestra como la “ganancia” en términos de nivel de 
significación que el investigador puede obtener aumentando un número determinado de 
unidades. Y aquí propone dos maneras de razonar: 

La primera surge de los métodos estadísticos utilizados para el análisis y 
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comprobación de las hipótesis; para la determinación del tamaño de la muestra, se parte 
de diferencias mínimas. 

Es decir, la pregunta que debe ser resuelta en un principio es qué nivel de 
confiabilidad y de significación desea el investigador. Existen tablas para diferentes 
coeficientes de correlación que especifican para cada nivel de significación el tamaño de 
muestra necesario. Pero para ello, como bien señala Galtung, es necesario conocer los 
valores parámetros. Cuando tales valores parámetros no son conocidos, es posible 
determinar el tamaño por medio de ciertas diferencias. El ejemplo típico señalado por 
Galtung es el siguiente: 

Se está interesado en la significación de proporciones. Cuando la proporción en la 


población es p, y la proporción en la muestra -—, la significación o nivel de confianza es: 
m 


x А 
Donde: -— = proporción еп la muestra 
m 


p = proporción en la población 
х = ordenada a la curva normal (en este caso con valor 1, es decir, 
con un nivel de significación de .32). 


Los niveles de significación mayormente utilizados en ciencias sociales son de .05 y 
.01; para ello la ecuación original sería ahora, en el caso de un nivel de significación del 
5%: 


х 
„= HS 196 PR, 


ТЕ sl 
7 р =-7 tenemos que: 


O E Ља о. NE 
4219601) q =1.96.4/025 ү 
redondeando el 1.96 a 2.00 tenemos que: 


d? = — 
m 


Esta ecuación nos va a señalar cuánto se gana en valores de significación cuando se 
aumenta la cantidad de unidades en la muestra. 
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CUADRO 2.° Valores correspondientes de tamaño de la muestra y diferencia significativa 


(z=2;p=0.5) 
m 1 4 9 16 25 36 49 64 81 
а 1 0.5 0.33 0.25 0.20 0.17 0.14 0.12 0.11 
m 100 121 144 169 225 
d 0.10 0.09 0.08 0.08 0.07 


Es decir que aumentos sucesivos еп el tamaño de la muestra producen disminuciones 
cada vez menores en el error estándar del estimador. En otras palabras, el decremento del 
error estándar cuando el tamaño de la muestra crece de 50 a 100, por ejemplo, es mayor 
que cuando la muestra crece de 100 а 150. Esto quiere decir que, a partir de un tamaño 
de muestra dado, los decrementos del error de estimación requieren tamaños de muestra 
mayores. 

La segunda manera de razonar, similar a la anterior, se hace a partir de la siguiente 
pregunta: ¿cuál es la utilidad que se desea en términos de disminución del error, para un 
aumento de tamaño de la muestra? Supongamos que uno decide que cuando no obtenga 
más que un aumento significativo de 2% o de 1% al aumentar 100 casos va a parar. 

Entonces tenemos: 


d (m) — d (m + 100) =0.02 o 
а (т) — а (т + 100) = 0.01 


la ecuación generalizada cuando р = q es: 
ч | здө 5 = 
e — — Y ——— | = 0.02 
sm N Y 5100 


o 51 se trata de duplicar la muestra, con niveles del 1% 


Р) W3- dez | ш 


Selección de una muestra aleatoria en poblaciones de tamaño finito 


La extracción de una muestra aleatoria simple en una población finita requiere un listado 
de todos los elementos de la población. Es decir, una vez definida la población 
(supongamos que es la de estudiantes en la Universidad Nacional Autónoma de México 
o las personas que sufragaron en las elecciones presidenciales en 1970 en Chile, o el 
total de alumnos que concurren a las escuelas primarias en Costa Rica, etc.) es necesario 
tener un listado de la misma. Uno procede a continuación a enumerar los individuos en 
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la lista, es decir, se les asigna un número. Por ejemplo, si la población total está 
compuesta de 45 671 individuos, se procede a numerarlos: 00001, 00002, 00003... 
04534, 04535... 45669, 45670, 45671. Es importante que en la enumeración el 
investigador coloque los ceros a la izquierda cuando corresponden, sobre todo si va a 
utilizar para la extracción tablas aleatorias; en otras palabras, cada número debe tener la 
misma cantidad de dígitos que el número total de la población. Estas tablas son un 
conjunto de números naturales que incluyen el cero, presentados en una forma particular 
y que son obtenidos por medio de algún procedimiento aleatorio (generalmente una 
computadora) que asegura que esos números no están dispuestos en ningún orden en 
particular, esto es, con el conocimiento de cualquier número en la tabla no es posible 
conocer qué número lo precede o antecede. 

Presentamos la selección de una muestra aleatoria en las siguientes etapas: 1) Se 
enumera, siguiendo los criterios señalados más arriba, a todos los individuos que 
componen el universo. 2) Se determina el tamaño de la muestra. 3) Se selecciona una 
página cualquiera de la tabla de números aleatorios (la selección misma puede ser hecha 
al azar). Puesto que en cada página los números aleatorios aparecen dispuestos en 
columnas, es necesario considerar tantas columnas como dígitos tenga la población. En 
el ejemplo que mencionábamos más arriba (población = 45 671 casos) tendremos que 
considerar 5 columnas. Reproducimos a continuación parte de una página de una tabla 
de números aleatorios: ' 


98 08 62 48 26 45 2 
35 44 13 18 80 33 1 
88 69 54 19 94 57 5 
20 15 12 33 87 25 01 6 
71 96 12 82 96 69 86 10 2 
18 63 33 25 37 98 14 50 6 


4 04 44 99 90 88 96 39 09 47 34 07 
2 32 41 94 15 09 49 89 43 54 85 81 
0 43 80 95 10 04 06 96 38 27 07 74 
2 98 94 62 46 11 61 79 75 24 91 40 
5 91 74 85 22 05 39 00 38 75 95 79 
5 71 31 01 02 46 74 05 45 56 14 27 


En el ejemplo que consideramos N es igual a 45 671; por tanto consideramos cinco 
columnas. Seleccionamos cualesquiera de las columnas (supongamos que partimos de la 
columna tres). Tendríamos entonces los números 08624; 82645; 24028; 40444; 99908; 
etc. Esto significa que el individuo 08624 es la primera observación muestral; puesto que 
el número 82645 no aparece en la lista, lo saltamos. La segunda observación muestral 
será el sujeto número 24028, y así sucesivamente hasta agotar la cantidad de casos 
necesarios para el tamaño de la muestra л. Si algún sujeto aparece repetido, también se 
remplaza con otra observación muestral. Una vez que se llega al final de una página sin 
que se haya terminado de completar los casos necesarios para la muestra, es posible 
pasar a otra página, o simplemente volver al comienzo, empezando ahora con otra 
columna, diferente de la inicialmente seleccionada. 

Como se ve, este tipo de procedimiento muestral implica una cantidad respetable de 
trabajo, sobre todo cuando la población es grande. 
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Una salida alternativa que ahorra tiempo consiste en enumerar tanto las páginas del 
listado de la población como a los individuos incluidos en cada una de las páginas. En el 
ejemplo seleccionado por nosotros, supongamos que tenemos 46 páginas (45 de ellas 
con 1 000 sujetos cada una y una página con 671), en las cuales los sujetos aparecen 
enumerados desde el 001 al 999 en cada página (obviamente en la última página los 
sujetos estarán numerados del 001 al 671). 

Procedemos entonces a trabajar también ahora con 5 columnas, sólo que ahora las dos 
primeras columnas nos indicarán el número de la página, y las tres siguientes, el número 
de los sujetos; por ejemplo, si hubiésemos comenzado con la columna seis de nuestra 
tabla, tendríamos los siguientes números 24826; 45240; 28404; 44999; 08896, etc.; es 
decir que seleccionamos el sujeto 826 en la página 24; el 240 en la página 45; el 404 en 
la página 28; el 999 en la página 44, y así sucesivamente. Lo mismo que en el 
procedimiento anterior saltamos los números que no correspondan a ninguna página, así 
como aquellos que aparezcan repetidos. La ventaja de este sistema es que se reconoce 
mucho más rápidamente qué sujetos aparecen repetidos. 

Hay otros procedimientos de selección aparte de tablas de números aleatorios, tales 
como los que se utilizan para la selección de los números a ser premiados en las loterías 
(en donde existen dos series independientes de selección: una para los números y otra 
para los premios); pero en este caso hay que recordar que es necesario reponer los 
números nuevamente en el bolillero, de manera tal que la probabilidad para cualquier 
bolilla sigue siendo la misma. Esto no se realiza, por ejemplo, en la lotería, es decir, una 
vez que un número ha sido extraído no es repuesto. 


Ventajas y desventajas del muestreo aleatorio simple 


Ventajas. a) No supone el conocimiento previo de ninguna de las características de la 
población de la cual se va a extraer la muestra. Esto es, a diferencia del muestreo 
estratificado, por ejemplo, no es necesario conocer la frecuencia relativa con que se dan 
las características poblacionales en cada uno de los estratos. Esto significa que una 
muestra aleatoria simple está libre de los sesgos que se pueden introducir por el uso de 
ponderaciones incorrectas en las unidades muestrales (ver muestreo estratificado). b) Es 
relativamente simple determinar la precisión de las estimaciones que se hacen a partir de 
las observaciones muestrales porque los errores estándar de los estimadores siguen 
distribuciones de probabilidad conocidas. Esta ventaja resulta del hecho de que la teoría 
del muestreo aleatorio simple está más desarrollada que ninguna otra. c) Tiende a reflejar 
todas las características del universo, esto es, cuando el tamaño de la muestra crece se 
hace cada vez más representativa del universo o población. 

Desventajas. a) Supone un listado completo de todas las unidades que componen la 
población. Obviamente, en muchos casos no se cuenta con una lista completa y 
actualizada de la población, lo que impide el empleo de este diseño muestral. b) Aun 
cuando se cuente con este listado, su numeración demanda mucho tiempo y trabajo que 
pueden ahorrarse si se emplea un diseño muestral distinto. c) Supone un tamaño de 
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muestra mayor que otros diseños para obtener un mismo nivel de confiabilidad. Esto 
significa que, para un mismo tamaño de muestra, las estimaciones hechas a partir de una 
muestra estratificada son más precisas que las mismas estimaciones hechas a partir de 
una muestra aleatoria simple. d) Es probable que las unidades muestreadas (si son 
individuos que viven en una ciudad, por ejemplo) queden muy distantes unas de otras, 
con lo cual el costo para obtener la información de estas unidades crece con la dispersión 
espacial de las mismas. Otros diseños muestrales permiten reducir al mínimo esta 
dispersión. 


Ejemplo de una muestra aleatoria simple 


A continuación se ilustran con un ejemplo las etapas ya señaladas en la extracción de 
una muestra aleatoria simple. La población está constituida por 5015 individuos que 
componen las 1003 mesas (de cinco vocales cada una) correspondientes a las doce 
comunas de Santiago de Chile. En cada una de estas comunas hay un conjunto de mesas 
constituidas por mujeres, y otro constituido por varones, además de las mesas formadas 
por extranjeros. 

De esta población se extrajeron dos muestras aleatorias simples de 200 individuos 
cada una. La primera de estas muestras (200 a) se extrajo directamente, vale decir, sin 
emplear el método de enumeración de páginas descrito en la página 99. La segunda se 
extrajo después de haber enumerado las páginas del listado de la población (200 b). En 
este caso, se formaron seis páginas con alrededor de 840 individuos cada una. 

Por medio de las dos muestras se estimaron dos parámetros: la proporción de varones 
en la población (p) y el promedio aritmético (u) de los puntajes correspondientes a una 
variable cuyo recorrido era 0, 1, 2, ... 9. Esto se hizo con el objeto de comparar las 
estimaciones obtenidas a partir de los dos métodos de extracción de las observaciones. 
La información contenida en cada una de las muestras fue la siguiente: 


CUADRO 2 

Muestra Muestra 

200 a 200 b 
Número de hombres en la muestra 95 98 
Proporción de hombres en la muestra 0.475 0.490 
Error estándar de proporción muestral 0.0354 0.0361 
Media aritmética de los puntajes en la muestra 5.20 5.12 
Error estándar de la media aritmética 0.200 0.195 


Los intervalos de confianza de 95% para (p) y (1) fueron los siguientes: 
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Muestra 200 a Muestra 200 b 


para (p): 0.405 < p < 0.545 0.420 < p < 0.560 
para (и): 481 <и < 5.19 478 <и < 5.46 


2) Muestreo sistemático 


Es muy similar al muestreo aleatorio simple. Hay que confeccionar un listado de todos 
los elementos que incluye la población; una vez en posesión del listado de la población, 
la diferencia estriba en el método para la selección de los casos. En la muestra aleatoria 
simple utilizábamos tablas aleatorias o procedimientos similares; aquí la selección se 
realiza por un procedimiento más mecánico que representa un gran ahorro de tiempo. 

Supongamos que la población es de 50 mil casos. Una vez hecho el listado y 
determinado el tamaño de la muestra (por ejemplo, de 1 000 casos) se procede de la 
siguiente manera: a) se selecciona al azar un número comprendido en la cantidad que 
resulte de dividir el tamaño de la población entre el tamaño de la muestra (en nuestro 
caso, entre 01 y 50), y a partir de ese número se seleccionan las unidades de la siguiente 
manera: Б) supongamos que el número seleccionado es el número 15; entonces extraigo 
los casos 15, 65, 115, 165, 215... etc. (es decir, cada 50 casos) hasta completar las 1 000 
unidades. 

Ejemplo: Si se utiliza el directorio de teléfonos o cualquier listado similar, se enumera 
a todos los sujetos listados; se selecciona una primera fracción que incluya todas las 
páginas con personas listadas, y a partir de la primera página se extraen sujetos con un 
número fijo (cada 20, cada 87, cada 140, o cualquier otro), hasta completar la cantidad 
de casos. 


Ventajas y desventajas 


Ventajas. a) Las ventajas técnicas son similares a las del muestreo aleatorio simple. b) 
Tiene una gran ventaja económica ya que facilita la selección de la muestra, sobre todo 
en aquellos casos en los que ya existe un listado. 

Desventajas. a) Desde el punto de vista estrictamente estadístico, este tipo de 
muestreo no es probabilístico ya que, 51 bien es correcto que, una vez iniciado el 
muestreo las probabilidades son las mismas рага la primera selección —es decir, 
estrictamente para los n sujetos que están incluidos en el número fijo—, una vez elegido 
este número, la muestra pasa a ser finalista (en nuestro ejemplo, la probabilidad de los 
sujetos 65, 115, 165, etc., es 1, mientras que la probabilidad de cualquier otro sujeto en 
el listado es 0). b) La desventaja más sobresaliente es la que puede resultar de los sesgos 
propios del listado que estamos utilizando. El directorio de teléfonos, por ejemplo, 
dispone de espacios mayores para el listado de comercios, empresas, etc., que para 
individuos particulares. De manera que, si no tomamos en cuenta esto, introducimos en 
nuestra muestra el sesgo del listado. 
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3) Muestreo estratificado 


Este tipo de muestra es conveniente cuando la población o universo puede dividirse en 
categorías, estratos o grupos que tienen un interés analítico, y que por razones teóricas y 
empíricas presentan diferencias entre ellos. La ventaja que ofrece la estratificación es 
que permite una mayor homogeneización de la muestra final. 

Por ejemplo, se puede estratificar una población según sexo, edad, status 
socioeconómico, nivel ocupacional, características de personalidad, étnicas, 
educacionales, etc. O bien, si las unidades de análisis son comunidades, se puede 
estratificarlas según su nivel de desarrollo socioeconómico, características de 
producción, geográficas, etc. Es decir que la estratificación en sí, la definición de cada 
uno de los estratos, es un problema de propósitos de investigación, tipo de preguntas que 
se quiere responder y teoría sustantiva. 

Una vez definidos los estratos y dividido el universo en estratos o valores según una o 
más variables, es posible diferenciar dos tipos de muestras estratificadas: a) Muestra 
estratificada proporcional, y b) Muestra estratificada no proporcional. 

La muestra estratificada proporcional es aquella en la cual la fracción de muestreo es 
igual para cada estrato; si existen diferencias en las fracciones de muestreo, se Пата no 
proporcional. 

Una vez determinada la proporción, se seleccionan las muestras dentro de cada 
estrato según los procedimientos del muestreo aleatorio simple señalado más arriba. 


Ejemplo 1: Muestra estratificada proporcional 


Supongamos que el propósito de la investigación es probar algunas hipótesis acerca del 
rendimiento escolar. Nuestro sistema de hipótesis plantea que existen diferencias 
significativas en cuanto al rendimiento escolar de los niños, según su extracción de clase, 
y una serie de otros factores que aquí vamos a dejar de lado para simplificar el ejemplo. 
Definido nuestro interés en estratificar a la población escolar según su clase social, 
supongamos ahora que estamos en una escuela concreta a la cual concurren 500 niños; 
determinamos la composición de clase de la escuela y el resultado es el siguiente: 50 
niños provienen de clase alta; 300 niños provienen de clase media, y 150 niños 
provienen de clase baja. 

Supongamos que el tamaño de muestra a seleccionar es del 10% del universo, esto es, 
50 casos. Si utilizamos muestreo aleatorio simple, la probabilidad de que la muestra 
resultante contenga exactamente un 10% de cada estrato (30 niños de clase media, 15 de 
clase baja y 5 de clase alta) es muy baja. Nosotros queremos garantizar que vamos a 
obtener exactamente esa cantidad. Entonces, en este caso vamos a trabajar con un 
muestreo aleatorio proporcional, es decir, la fracción de muestreo para cada estrato será 
exactamente la misma: 10%. El método de selección entonces es el siguiente: 

a) Estratifico a la población en tres clases: niños de clase media, alta y baja, 
respectivamente. 

b) Confecciono un listado independiente para cada estrato, enumerando a mis sujetos 
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(en la lista А —de clase media— unos niños estarán enumerados del 001 al 300; en la 
lista B, de clase baja, estarán enumerados del 001 al 150; en la lista C estarán 
enumerados del 01 al 50). 

c) Procedo a la selección, por los métodos indicados en el muestreo aleatorio simple, 
de 30 casos en la lista 4, 15 casos en la lista B, y 5 casos en la lista C. Con ello logro que 
la muestra de 50 casos sea una réplica proporcional exacta del universo, en lo que a clase 
social se refiere. Para los propósitos de generalización las muestras estratificadas 
proporcionales no ofrecen complicaciones en el cálculo. 


Ejemplo 2: Muestra estratificada no proporcional 


Estamos en la misma escuela del Ejemplo 1. Estamos interesados en comparar los 
rendimientos de las distintas clases. Ocurre que con la muestra que obtuvimos mediante 
el muestreo aleatorio estratificado proporcional no contamos con suficientes casos de 
niños de extracción de clase alta, ya que tenemos solamente 5. 

Decido entonces que para los propósitos de mi análisis voy a necesitar 25 casos en 
cada estrato, es decir que mi muestra va a tener un total de 75 casos. Tendré entonces un 
muestreo estratificado no proporcional, ya que no voy a respetar la proporción original 
en el universo. 


CUADRO 3 
Universo Muestra 
Clases Sujetos Sujetos Fracción de muestreo 
Clase alta 50 25 50% 
Clase media 300 25 8.3% 
Clase baja 150 25 16.7% 
500 75 


Una vez decidida la cantidad total de la muestra y la cantidad de casos en cada 
estrato, procedo a seleccionarlos según los mismos procedimientos indicados para el 
muestreo aleatorio simple, tomando 25 casos de cada lista (4, B y C). Obtengo entonces 
el cuadro 3. 

Esta tabla es importante para los propósitos de generalización a la población, ya que 
ahora tengo que ponderar las diferentes fracciones de muestreo. 

Para ello, en el caso de la media aritmética, por ejemplo, hay que operar de la 
siguiente forma: a) Calcular la media aritmética para cada estrato; b) Ponderarlas según 
el tamaño relativo del estrato. 
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CUADRO 4 


Estratos 
Alto Medio Bajo Total 
Tamaño del estrato 50 300 150 500 
Peso (Pi) 0.10 0.60 0.30 1.00 
Tamaño de la muestra 25 25 25 
Media aritmética (Mi) 24 20 17 
Desviación estándar (gi) 5 4 7 


El cálculo de la media muestral será realizado de acuerdo a la siguiente fórmula: 
Mr = > P 4 М, 


Donde: М, = media aritmética de cada estrato 
Р; = peso de cada estrato 


En nuestro caso: 


My = (20 х 0.60) + (17 х 0.30) + (24 х 0.10) = 19.5 


En el caso del error estándar: 


or = (4 х 0.60) + (7 х 0.30) + (5 х 0.10) = 5.0 


Ventajas y desventajas 


Ventajas (de las ofrecidas por el muestreo aleatorio simple). a) La muestra es más 
homogénea, garantizando la representatividad. b) Elimina los errores en la estimación 
que son producto de diferencias entre estratos. c) Una ventaja adicional ofrecida por el 
muestreo estratificado no proporcional es la de posibilitar un mejor conocimiento de 
grupos pequeños (en relación a la cantidad total de casos). 
Desventajas. a) Supone el conocimiento previo de las características de la población, 
a partir de las cuales se estratifica. b) Son de costo más elevado que las aleatorias 
simples, en dinero y energía. c) Exige tratamientos estadísticos de cálculo más complejo. 
d) Pueden existir dificultades en la determinación de estratos homogéneos. e) La muestra 
estratificada proporcional algunas veces puede no proveer un número suficiente de casos 


para análisis comparativos inter-estratos. 


4) Muestreo por conglomerados 
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Muchas investigaciones en ciencias sociales tienen como objeto de estudio unidades 
tales como naciones, estados y similares, que admiten subdivisiones o que ya contienen 
distintos conglomerados. 

En este sentido hay bastante similitud entre las muestras estratificadas y las muestras 
por conglomerados, aunque existen diferencias importantes en cuanto a los métodos de 
selección en uno y otro caso. 

En términos generales, el investigador considera el muestreo por conglomerados en 
aquellos casos en los cuales la población a estudiar está dispersa a lo largo de áreas 
geográficas extensas o situaciones similares, donde los costos para alcanzar las unidades 
resultan muy elevados. 

Los procedimientos para la selección de la muestra en este tipo de muestreo son los 
siguientes: 

a) Es necesario dividir a la población en conglomerados lo más homogéneos posible. 
Esta división por conglomerados puede hacerse en varios niveles; es decir, se puede 
operar en varios escalones o etapas. 

b) Una vez determinados los conglomerados, se selecciona al azar del primer nivel de 
conglomerados una proporción determinada de los mismos (si seleccionamos todas las 
unidades dentro de estos conglomerados, hablamos de muestra de escalón o de una sola 
etapa). 

с) Con los conglomerados seleccionados en b, procedemos a una nueva selección de 
conglomerados al interior de cada uno de ellos (nuevamente, si tomamos todos los casos 
dentro de este segundo nivel, hablamos de muestras de 2 escalones.) 

d) Si procedemos por el mismo método a seleccionar en un tercer, o cuarto nivel, 
hablamos de muestras de escalones múltiples. 

Téngase bien claro que, una vez determinados los conglomerados, se procede a una 
selección aleatoria entre conglomerados, y una vez seleccionados éstos, tomamos todas 
las unidades de cada conglomerado seleccionado. Ésta es la diferencia entre una 
muestra por conglomerados y una muestra estratificada. En la muestra estratificada, una 
vez determinados los estratos, seleccionábamos los casos de cada estrato (proporcional o 
no proporcionalmente). 

Un ejemplo nos ayudará mejor a seguir con mayor detalle el método para la selección 
de unidades en este tipo de muestreo por conglomerados. Y vamos a elegir un ejemplo 
particularmente extenso para hacer más clara la exposición. 

Supongamos que nos interesa determinar ciertas características sociopsicológicas en 
los Estados Unidos Mexicanos, es decir que la unidad de análisis es un país. México 
tiene una extensión de unos 2 millones de kilómetros cuadrados y aproximadamente 60 
millones de habitantes [datos de 1979. E.]. Si para los cálculos vamos a partir de datos 
agregados sobre características de los mexicanos, plantear una muestra aleatoria simple o 
aun una muestra estratificada implicaría el problema de la dispersión de las unidades a lo 
largo del país. Por lo tanto, nos decidimos por una muestra por conglomerados. Y vamos 
a realizarla en varios escalones: 


i) En el primer escalón, vamos a tomar la división política de México еп 32 Estados.* 
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Tendríamos entonces el mapa que aparece еп la página siguiente. 

ii) Obsérvese que numeramos los 32 estados, conglomerados ahora. Procedo a 
continuación a seleccionar al azar 11 de estos conglomerados (aproximadamente un 
tercio). El sistema de selección puede ser puramente al azar; es decir, utilizamos una 
tabla, o simplemente colocamos 32 bolitas, y vamos extrayendo de una en una hasta 
completar 11 (no olvidar de reponer); o como hemos elegido en este caso, seguir el 
sistema de las “agujas de reloj”, es decir, seleccionamos de entre las tres primeras al azar 
una y luego procedemos como en el caso del muestreo sistemático a seleccionar cada 
tercera. En otras palabras, selecciono al azar la unidad 1, 2 y 3; supongamos que resulta 
elegida la número 3, entonces saldrán automáticamente seleccionadas las unidades 3, 6, 
9, 12, 15, 18, 21, 24, 27, 30 y 1. Con este sistema busco tener representados todos los 
segmentos geográficos a lo largo de la República. Éstos son los estados o conglomerados 
que aparecen sombreados en el mapa. Si se tratara de una muestra de un escalón, 
censaría a todos los habitantes de los estados seleccionados; pero vamos a proceder a 
nuevos escalones, y para representarlo vamos a utilizar el Distrito Federal, que 
suponemos que ha salido seleccionado. 

iii) Vamos a utilizar nuevamente aquí las 25 divisiones zonales (13 municipios y 12 
cuarteles) utilizadas en el Censo Nacional de Población de 1970 (ver mapa 2). 

El Censo Nacional de Población de 1970, del cual tomamos la división del Distrito 
Federal en 13 delegaciones censales, basó la jurisdicción en criterios tales como 
superficie en kilómetros cuadrados, número de localidades, población estimada para 
1970, vías de comunicación existentes y accidentes topográficos. 

La Zona 1, que concentra la mayor cantidad de habitantes (ver cuadro 5), fue dividida 
en cuarteles (12 en total). 

Para los fines del muestreo por conglomerado, cada cuartel de la primera división 
censal 1 (Ciudad de México) será tratado como un conglomerado aparte. En este caso 
habría que subdividir el mapa en 24 conglomerados. 

іу) Seleccionaremos nuevamente por el sistema de las “agujas de reloj” un tercio de 
las zonas. Las zonas sombreadas corresponden a la selección que se produjo por efecto 
de la extracción del número 2, en la primera selección al azar entre las tres primeras 
zonas. Recordemos que este procedimiento se repite en el resto de los 10 conglomerados 
seleccionados еп el primer escalón. Si nos detenemos aquí y censamos a todos los 
individuos incluidos en las zonas resultantes, tenemos una muestra de dos escalones. 
Pero vamos a seguir más adelante. Para ello continuamos utilizando el Distrito Federal, 
aunque ahora nos concentremos en la Zona 2. 
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Mara 1: República Mexicana; primer escalón en muestra por conglomerados. 
= e 32 conglomerados tomando para cada conglomerado la división política en Estados. 
Еа 
— 
MS e a 
————„_-„ М. 
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Mara 2: Distrito Federal. División 
central en 13 municipios y 12 cuar 
teles (censo de 1970). й munici- 
р 1 (Ciudad de México) incluye 
os conglomerados del 1 al 12. 
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Солрво 5. Divisiones censales y cuarteles en el Distrito Federal para el 
Censo Nacional de Población de 1970 


División censal Habitantes 
1. Ciudad de México 2 902 969 
Cuartel: 

1. 584 879 

П. 306 530 

ПІ. 141 347 

IV. 104 156 

У. 112779 

УІ. 97675 

УП. 166 577 

VIII. 231 016 

ІХ. 429 664 

X. 199 653 

ХІ. 226 983 

ХП. 301710 
2. Azcapotzalco 534 554 
3. Coyoacán 339 446 
4. Cuajimalpa 36 200 
5. Gustavo A. Madero 1 186 107 
6. Iztacalco 477 331 
7. Iztapalapa 522 095 
8. Magdalena Contreras 75 429 
9. Milpa Alta 33 694 
10. Obregón 456 709 
11. Tláhuac 62 419 
12. Tlalpan 130 719 
13. Xochimilco 116 493 
Total 6874 165 

MAPA 3 
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v) En el tercer escalón, vamos a definir conglomerados en función de la cantidad de 
habitantes. Para ello vamos a dividir la zona en x áreas de aproximadamente 5 mil 
habitantes cada una. Las divisiones que figuran a continuación en el mapa 3 no tienen 
que ver con los 5 mil habitantes, sino que se hace con el propósito de ilustración 
simplemente. 

vi) Procedo nuevamente a seleccionar, por los mismos métodos señalados en cada 
escalón anterior, digamos ahora a la cuarta parte de las subzonas o conglomerados de 
tercer nivel. Las áreas sombreadas corresponden a los conglomerados seleccionados. 
Procedo en forma idéntica con el resto de las 7 zonas seleccionadas en el segundo nivel. 
Si el investigador decide detenerse en este escalón, debería tomar entonces todos los 
casos dentro de cada zona. Pero nosotros vamos a proceder más adelante. 

vii) Tomamos, para ejemplificar, el conglomerado número 32. Voy a seleccionar 
ahora manzanas dentro del conglomerado. Para ello las enumero y procedo en forma 
idéntica a los casos anteriores. El criterio para seleccionar las manzanas no seguirá el 
sistema de las agujas de reloj, sino que seleccionaremos al azar 20% de ellas. 
Nuevamente, de detenerme aquí censaría a todos los habitantes dentro de las manzanas 
seleccionadas. Podría seguir más adelante y seleccionar ahora edificios y, una vez 
seleccionados éstos, censar a todos. El mapa 4 señala las manzanas seleccionadas en el 
cuarto escalón. 

Como el lector podrá anticipar, el sistema de cálculo para las estimaciones de 
parámetros es complicado, ya que hay que tomar en cuenta los factores de 
proporcionalidad en cada escalón. 


MAPA. 4. Ejemplo del 4° escalón. Corresponde al conglomerado 32 del cuartel 2 de la 
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Ciudad de México. El sombreado corresponde a las manzanas seleccionadas. 


Ventajas y desventajas 


Ventajas. a) La ventaja principal de este tipo de muestreo es la concentración de las 
unidades en áreas, lo que evita el desplazamiento a lo largo de áreas muy extensas, 
representando consecuentemente una economía de gastos en términos de energías, costos 
y tiempo. b) Otras ventajas son similares a las ofrecidas por los tipos de muestras 
indicadas más arriba. 

Desventajas. a) Exige tratamientos estadísticos algo complejos. b) En comparación 
con el muestreo aleatorio simple o el estratificado, representa pérdidas en precisión. c) 
La muestra pierde carácter de probabilística, en la medida en que, una vez seleccionados 
los conglomerados primeros, la probabilidad de ser extraídos que tienen los individuos 
del resto de los conglomerados es cero. 


En síntesis 


Los cuatro tipos de muestras aleatorias que presentamos pueden ser aplicados en 
situaciones diferentes, siendo también posible hacer combinaciones entre ellos. Es decir, 
se puede partir de muestras de conglomerados e incluir en los escalones finales criterios 
de muestra estratificada, por ejemplo, aunque por supuesto esto implica complicaciones 
adicionales en términos de cálculos estadísticos en el momento de la estimación de los 
parámetros. 

La muestra aleatoria simple, cuando el número de casos es abundante, en términos 
generales debe ser preferida al resto de las otras muestras, particularmente cuando no se 
conoce lo suficiente sobre los parámetros poblacionales. Cuando es posible estratificar 
hay que hacerlo, ya que esto homogeneiza la muestra y los cálculos consiguientes 
resultan de mayor riqueza y representatividad. 

La muestra por conglomerados, si bien tiene algunas limitaciones en términos de 
inferencia, representa muchas veces la única salida cuando los recursos disponibles no 
son suficientes para plantear cualquiera de las dos primeras alternativas. 

La muestra sistemática debe ser utilizada únicamente en aquellos casos en que resulte 
imposible o demasiado costoso aplicar una muestra aleatoria simple, o como una etapa 
secundaria de un muestreo complejo. 
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Describimos ahora rápidamente algunos tipos de muestras по probabilísticas, 
concentrándonos principalmente en las “muestras” para probar hipótesis sustantivas (ver 


Galtung),? por su interés para la investigación. 


B) MUESTRAS NO PROBABILÍSTICAS 


Consideramos aquí 3 tipos: 1) Muestras casuales. 2) Muestras intencionales. 3) Muestras 
por cuotas. 

Recordemos que estas muestras tienen poco valor en términos de estimación, ya que 
no es posible a partir de ellas calcular el error de estimación de parámetros. Sin embargo, 
muchas veces resultan de utilidad en términos de inmersión por parte del investigador en 
el tema. Un caso especial es representado por las muestras para proponer hipótesis 
sustantivas, cuyo tratamiento en detalle se hará en la sección correspondiente. 


1) Las muestras casuales 


Son la técnica favorita de muestreo de reporteros de canales de televisión y de la radio, 
amén de algunas agencias de investigación de mercado. La técnica consiste simplemente 
en entrevistar a sujetos en forma casual —por ejemplo, uno de cada 10 individuos que 
pasan por una esquina determinada de la ciudad—. En su grado más simple, este tipo de 
muestreo y las investigaciones en las cuales se aplica requieren personal menos 
calificado, de manera que el costo resulta muy reducido. Sin embargo, como señalamos 
varias veces, a partir de ellas es casi imposible hacer alguna generalización válida que 
vaya más allá de las características de los individuos que andan a pie, en determinadas 
horas, por determinadas calles, etcétera. 


2) Las muestras intencionales 


Son el producto de una selección de casos según el criterio de algún experto; de esta 
forma se seleccionan algunos casos que resultan “típicos”. De nuevo, estas muestras no 
son totalmente inútiles, porque resultan de importancia en las etapas exploratorias de la 
investigación, sobre todo si se utilizan estos casos como “informantes clave” sobre 
situaciones específicas (ver diagrama en el capítulo Т, “La organización de un survey”). 


3) Las muestras por cuotas 


Son en alguna medida una especie de muestras, estratificadas, y son muy utilizadas por 
algunas agencias de investigación de mercado. A una serie de entrevistadores 
(profesionales o no) se les fija una cuota de individuos a entrevistar, especificándoles sus 
características (por ejemplo: varones, casados, propietarios de automóvil, no mayores de 
50 años ni menores de 25). Cada entrevistador selecciona por su cuenta y entrevista a los 
sujetos según un cuestionario, hasta completar su cuota. Como debe ser evidente a estas 
alturas, el sesgo del entrevistador es una de las desventajas potenciales más importantes 
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que tiene este tipo de muestreo. 


C) MUESTRAS PARA PROBAR HIPÓTESIS SUSTANTIVAS 


Habíamos señalado en el comienzo del capítulo que no toda muestra tiene como 
propósito la estimación de parámetros poblacionales a partir de las características de la 
muestra, sino que las muestras podrían tener también interés analítico por sí mismas. 
Siguiendo de muy cerca a Galtung, vamos a dedicar algún espacio a este tipo de muestra, 
ya que por su uso es una de las más difundidas. 

Las muestras para poner a prueba hipótesis sustantivas deben seleccionarse de manera 
tal que contengan el tipo de elementos a los cuales hacen referencia las proposiciones en 
que está interesado el investigador. Es decir, en este caso el investigador no está tan 
interesado en la generalización como en la relación específica entre variables; de manera 
que quiere garantizar que su muestra contenga unidades suficientes de un tipo 
determinado. Es decir que la muestra debe ser suficientemente heterogénea. Galtung es 
muy claro en diferenciar las muestras casuales e intencionales y por cuota, señalando los 
problemas a que cada una de ellas puede dar lugar. Aquí se trataría de una variación de 
la muestra por cuota, aunque ahora teniendo cuidado especial en la selección de las 
unidades para cada casillero. 

En general, dice Galtung, el investigador debe responder a tres preguntas para decidir 
el tamaño de su muestra: a) ¿cuántas variables quiere el investigador analizar 
simultáneamente?; Б) ¿cuál es el número máximo de valores que desea utilizar por 
variable?, y c) dadas las técnicas analíticas a utilizar, ¿cuál es el valor mínimo por celda 
que necesita? 

Es decir que por medio de la respuesta a las dos primeras preguntas va a determinar el 
tamaño de la matriz de datos (espacio de atributos, en lenguaje de Barton), y por la 
última va a satisfacer los requisitos referentes a la prueba de hipótesis estadísticas. 

El procedimiento para la determinación del tamaño de la matriz de datos depende 
entonces de la cantidad de variables (n) y del número de valores en cada variable (r). La 
fórmula para la determinación del tamaño de la matriz será: 


Matiz вет. «тз Жу... Ta 
El siguiente cuadro especifica la cantidad de celdas que resultan de combinaciones 
para diferentes números de variables, con valores iguales para cada una de ellas. Los 


números que figuran entre paréntesis corresponden a 10 y 20 casos por celda, 
respectivamente. 
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Cuanro 6. Tamaño de la matriz para diferentes combinaciones de variables 
con idéntica cantidad de alternativas 


Número de Número de valores en las variables (r) 
variables 
(n) 2 3 4 5 
1 2 (20-40) 3 (30-60) 4 (40-80) 5 (50-100) 
2 4 (40-80) 9 (90-180) 16 (160-320) 25 (250-500) 
3 8 (80-160) 27 (270-540) 64 (640-1 280) 125 (1 250-2 500) 
4 16 (160-320) 81 (810-1 620) 256 (2 560-5 110) 625 (6 520-12 500) 


..........  ............  +..+............+..o  ............... 


Leon... ....  — ............ —....o o... ...... Э эше ..........sso 


Tomemos un ejemplo para la determinación del tamaño de la matriz cuando los 
valores de algunas variables son diferentes. Supongamos que la combinación más 
compleja de variables en la investigación va a ser el resultado de un análisis de А? o de 
proporciones, para la prueba de la hipótesis, de las siguientes variables combinadas: a) 
Sexo. que tendrá dos valores: masculino-femenino. b) Educación: que tendrá tres 
valores: alta-media-baja. c) Religiosidad: que tendrá tres valores: alta-media-baja. d) 
Participación política: que tendrá 4 valores: alta-media alta-media baja-baja. 

La matriz de datos para el análisis simultáneo de las cuatro variables tendrá entonces 
72 celdas (2 x 3 x 3 x 4), para lo cual necesitaremos al menos una muestra de 720 casos 
(10 casos por celda). La matriz final tendrá la siguiente forma: 


Солдрво 7. Matriz de datos resultante рата la combinación de las variables. 
Sexo (masculino-femenino); Educación: (alta-media-baja); Religiosidad: (alta- 
media-baja); Participación Política: alta-media alta-media baja-baja) 


Varones Mujeres 


Participación 
política 


Alta 
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Es decir que para probar mi hipótesis tengo que tener varones y mujeres, con distintos 
niveles educacionales y diferentes grados de religiosidad, para medir su influencia sobre 
la variable participación política. 

Galtung presenta una doble línea de argumentación para justificar la cantidad de 10 a 
20 casos por casillero. Por la primera demuestra que el número de casos debe ser 
suficiente para aproximar la distribución muestral a la población. Para ello parte de 
intervalos de confianza. Por la segunda el argumento está dirigido hacia la necesidad de 
que los porcentajes que se computen estén sujetos a grandes variaciones, cuando se dan 
pequeños cambios en las cifras absolutas. Si el cambio en una unidad produce una 
variación de 5 puntos de porcentaje y ése es el valor máximo que queremos aceptar, 
entonces esto nos dará una base de 20 cuando hay dos celdas, de 30 cuando hay tres, 
etcétera. 

Para finalizar, queremos insistir en lo siguiente: las muestras para probar hipótesis 
sustantivas son de mucha utilidad y es posible compatibilizar las exigencias de un 
muestreo probabilístico con las exigencias para probar hipótesis sustantivas. Las ventajas 
de plantear el problema del muestreo de esta manera están vinculadas al proceso total de 
la investigación, ya que obligan al investigador a explicar como hipótesis, y a pensar 
desde un comienzo en los métodos a utilizar en el análisis. 
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IV. EL CUESTIONARIO 


JORGE PADUA 
INGVAR AHMAN 


EL OBJETIVO de este capítulo es ofrecer algunos ejemplos de cuestionarios, 
presentándolos en una forma sistematizada, de tal modo que el investigador posea 
algunas indicaciones acerca de cómo colocar más fácilmente sus indicadores en el 
cuestionario. Concentramos nuestra atención en los aspectos más técnicos de la 
construcción de un cuestionario que pueden contribuir a una minimización de los errores 
en el registro de los datos. 


MOTIVACIÓN EN EL ENTREVISTADO Y EL CUESTIONARIO COMO UNA UNIDAD 


El respondente de una entrevista puede tener un alto o bajo grado de motivación para 
colaborar y contestar las diferentes preguntas. La motivación depende de factores tales 
como: objetivo del estudio, quién lo patrocina, el tipo de preguntas, disponibilidad del 
sujeto, duración de la entrevista, etc., así como de la apariencia y desempeño del 
entrevistador. Además de estas causas, que se refieren a la entrevista como proceso, hay 
dos factores de importancia en lo concerniente al cuestionario como unidad, que se 
refieren a la motivación del respondente. Éstos son: el orden de las preguntas y el 
tamaño del cuestionario. 


El orden de las preguntas 


Estudiemos en un diagrama lo que puede ocurrir durante una entrevista con respecto a 
estos dos factores. Supongamos que representamos el tiempo de la entrevista en el eje 
horizontal y el grado de motivación a través del eje vertical: 
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Comienzo de la entrevista Tiempo 


Un caso de alta motivación: 


Relajamiento 


“ А 


Comienzo de la Final de la 
entrevista 


Carta previa їп. 
formando sobre 
la futura entre 
vista 


entrevista 


En este caso, el encuentro ya ha sido preparado para la entrevista, a través de una 
carta enviada algunas semanas antes del comienzo del trabajo en el campo. La idea de la 
remisión de una carta previa es que una o varias personas soliciten por escrito al 
respondente su cooperación, resaltando lo necesaria que es y explicándole, además, el 
significado del estudio y su utilidad. Si el texto ha sido preparado debidamente y la carta 
de introducción ha sido suscrita por las personas apropiadas (dependiendo de qué trata el 
estudio y quiénes son los respondentes), la carta motivará al entrevistado respecto de la 


entrevista. ! 

Cuando llega el entrevistador, encuentra la situación preparada y en muchos casos se 
enfrenta a un individuo que tiene verdadera curiosidad en saber más acerca de la 
entrevista. En algunos casos, si la carta de introducción está hecha de un modo poco 
apropiado, puede ocurrir un efecto contrario al deseado, es decir, un rechazo inicial a la 
situación de entrevista. 

Lo primero que el entrevistador debe hacer cuando la entrevista ha comenzado es 
lograr que el respondente se relaje y confíe en el entrevistador. Para hacer más fácil esto, 
necesitaremos un tipo especial de preguntas con que iniciar el cuestionario. Áreas de 
especial interés para el encuestado, como deportes y otras actividades de tiempo libre, 
algunas preguntas sobre informaciones acerca de comunicación de masas son, por lo 
general, adecuadas, si el respondente ha oído sobre este u otro tema, si está interesado en 
algún artículo de cualquier periódico o revista, etcétera. 

En B y C en el diagrama, la motivación no cambia y el tipo de preguntas no es ni 
mucho ni poco motivador. Por ejemplo: algunas preguntas de hecho, como ocupación, 
ocupación de los padres, escalas, etc. En D y E nos acercamos al final del cuestionario y 
se hacen presentes las preguntas emotivas. Por ejemplo, en algunos países, preguntas 
políticas o de ingresos y otras más personales sobre su familia, amistades, etc. Aquí, 
normalmente será necesario reforzar la confianza ganada y aun puede ser necesario que 
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el entrevistador ayude motivando al individuo para una respuesta específica. 

En F se introduce nuevamente la atmósfera de relajamiento y tranquilidad y es de 
suma importancia dejar a la persona satisfecha con sus experiencias, aunque debe 
recordarse que la entrevista siempre se efectúa en forma voluntaria y que el avance de la 
técnica de entrevista en un país depende de cómo se realicen las entrevistas. 

En todos estos pasos, desde 4 hasta F, es importante recordar que las preguntas se 
presentan juntas en campos de intereses similares. Hay una “batería” de preguntas 
relativas a ocupaciones; otra, a medios de comunicación de masas; una más referente a 
ingresos y nivel de vida, consumos en la familia, etc. Algunas “baterías” de ítems se 
presentan como escalas en hojas separadas o en otros métodos especiales que 
describiremos más adelante. En estos casos es evidente que los ítems representan el 
mismo campo. En algunos casos el investigador debe repetir un campo de interrogantes 
antes y después de una batería de preguntas. Esto, naturalmente, con el objeto de 
encontrar alguna ligazón entre los diferentes campos o, simplemente, para verificar la 
confiabilidad de las respuestas. 

Veamos ahora qué sucede en caso de motivación baja: 

Dos casos de motivación baja: 


o +++ 


i 

D E | 

— Carta introductoria Comienzo de la Fin de la 
entrevista entrevista 


En este caso, el comienzo fue tan favorable como en el ejemplo anterior. Las 
diferencias están en que el cuestionario parte con el tipo de preguntas D y E. El 


respondente se pone suspicaz, se pregunta qué significa todo esto y rehúsa continuar. 
Tomemos el caso siguiente: 


о+++ 


| 
[Fin de la 


| 

: | 

- Carta Comienzo de la | 
| 1 entrevista 


previa entrevista 


En este caso el respondente fue muy poco motivado desde la partida, ya que la carta 
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previa estaba mal hecha y lo puso suspicaz. La entrevista pudo comenzar porque el 
entrevistador logró motivar al respondente acerca de su importancia. Sin embargo, el 
orden de las preguntas no sirvió para arreglar la situación, de tal modo que el R se 
confundió y el resto de la entrevista estuvo a punto de fracasar, aunque llegara a su final 
natural. Las respuestas dadas a las preguntas fueron cortas, incompletas, sin ningún 
interés por parte de R. En muchos casos, el entrevistador no supo qué contestar y 
deseaba seguir rápidamente con las siguientes preguntas. Al final de la entrevista, el 
respondente estaba seguro de una sola cosa: era la última vez que intervenía en una 
entrevista. 

Aunque la carta previa y la personalidad del R, en este caso, fueron factores 
predominantes para determinar el éxito de la entrevista, un buen enfoque de las 
preguntas puede, finalmente, dejar en un nivel neutral la entrevista. 

Un último comentario referente a una persona “bien motivada” para cooperar en una 
entrevista. Esta clase de motivación la hemos marcado con ++; indica el máximo de 
información que el R puede dar y no debe confundirse con un estado de sobreexaltación 
de parte del R, que puede ser tan pernicioso como una baja motivación. En este caso, el 
R parte conversando sobre cualquier cosa, sólo por agradar al entrevistador, exagerando 
hechos e, incluso, posiblemente mintiendo. El procedimiento adecuado que debe seguir 
el entrevistador en este caso es aquietar los sentimientos, ser más frío, y tratar de 
concentrarse en actos, dejando al R disertando algunos minutos y en seguida 
concentrarse en el exacto contenido de las preguntas. 


El tamaño del cuestionario 


Un cuestionario demasiado corto lleva a una pérdida de información y no da tiempo al R 
para compenetrarse del problema. Existen algunos casos (por ejemplo, entrevistas de 
mercado e investigaciones de densidades de tráfico) en los que la información que se 
necesita es limitada y las entrevistas, por consiguiente, deben ser cortas para ser 
económicamente accesibles. 

Un cuestionario demasiado largo, por otro lado, no es aconsejable, ya que podría 
dificultar mantener en un nivel adecuado el interés del entrevistado. Incluso 51 se ha 
informado que la motivación ha sido bastante alta en la mayoría de los casos durante 
todo el transcurso de la entrevista y que sólo se perdió un porcentaje muy pequeño, no es 
seguro que el respondente se preste en otra oportunidad a aceptar una entrevista de tal 
magnitud. Aunque la entrevista no haya sido traumática para el R, le dejó el recuerdo de 
la pérdida de medio día de trabajo. Por lo tanto el R puede negarse a una futura 
entrevista, aunque en principio dicha persona estuviera interesada, debido al recuerdo del 
tiempo perdido en la anterior. Hay gastos proporcionalmente excesivos y bastantes 
dificultades en su manejo en comparación con las ventajas que ofrece sobre un estudio 
de tamaño mediano. Incluso, el procedimiento de datos y el análisis pueden ocupar tanto 
tiempo como algunos estudios de tamaño mediano, que aportarían bastante más 
información a un investigador que un solo estudio de gran tamaño. En algunos casos la 
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justificación de un estudio extenso se basa en el tipo de análisis a efectuar, por ejemplo, 
un análisis factorial. Esto es cierto sólo en parte, ya que nuestra búsqueda va dirigida 
más a la calidad que a la cantidad de las relaciones. Como ejemplo podemos presentar 
con más utilidad unos 5-6 ítems en forma de escala “Guttman”. En ella la escalabilidad 
ha sido controlada en parte del universo a investigar durante el pretest, en vez de 
presentar un grupo de ítems arbitrarios en un cuestionario final. En el último caso puede 
suceder que, de unos 30 ítems, sólo 5 o 6 aparezcan realmente bastante correlacionados. 
Lo que queremos destacar aquí es la necesidad de evitar extender la cantidad de 
preguntas más allá de los propósitos de la investigación. La multiplicación de preguntas 
que no se tiene previsto analizar produce pérdidas de tiempo, a veces la extensión del 
cuestionario invita a los respondentes a rechazar la entrevista, significa costos más altos, 
y a la larga la mayoría de las veces terminan sin ser utilizadas, ya que después del primer 
análisis de los datos, los cuestionarios se depositan en cualquier lugar y se olvidan. 

Por supuesto, es una labor bastante difícil precisar la amplitud adecuada de un 
cuestionario de tamaño medio. Esto depende del tipo de preguntas, las que, a su vez, 
dependen del campo que se está investigando, etc. Trataremos, sin embargo, de dar una 
primera indicación al lector que está introduciéndose en este tipo de investigación: 


Motivación 


135 min. 180 min. 


_ Número de ч 
Preguntas 100 
Comienzo de la entrevista Entrevista tamaño medio 


Una entrevista con un término medio de 75 minutos toma, en los casos de mayor 
rapidez, unos 40 minutos, y en los casos excepcionalmente lentos, unos 150 minutos. En 
algunos cuestionarios hay una parte de las preguntas que se aplican solamente en 
circunstancias especiales, y otras que se aplican a todos los sujetos. Por ejemplo, las 
preguntas de la 1 a la 20 pueden estar diseñadas para ser respondidas por todos los R; las 
preguntas de la 21 a la 50 se hacen solamente a los entrevistados que tienen entre 20 y 50 
años; las preguntas de la 57 a la 70, a entrevistados mayores de 50 años. Esto 
naturalmente acorta el tiempo efectivo de la entrevista. 

Como indicación general hay que evitar que los entrevistadores se presenten ante los 
respondentes con un cuestionario que parezca voluminoso (aun en los casos en que el 
instrumento no se aplique a cada R en su totalidad). Conviene en estos casos imprimir el 
cuestionario con tipos pequeños o separar distintos formularios para diferentes 
submuestras. 
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Espacio para las preguntas еп el cuestionario 


El conjunto total del cuestionario comprende: a) un subconjunto mayor en el que se 
registran las preguntas y las respuestas, y b) un subconjunto menor —que ocupa las 
primeras y las últimas páginas del cuestionario— que contiene información del Registro 
General de la Unidad, así como comentarios e informaciones de los entrevistadores. 


Un ejemplo de la forma de diseñar un cuestionario 


51 hacemos un marco еп cada página y lo consideramos en dos mitades (una para las 
preguntas y otra para las respuestas), obtendremos lo siguiente: 


Preguntas Respuestas 


Dejemos ahora un espacio separado para la codificación y coloquemos algunas 
preguntas en las páginas. 


Empezamos usando un código general para tres categorías de “respuestas” que son 
comunes a todas las preguntas: 


= Según las instrucciones, esta pregunta no se aplica. 
= Se hizo la pregunta al R, pero no quería contestar o no sabía contestarla (en una 


manera codificable). 
X= No se hizo la pregunta al R, por no estimarlo conveniente el entrevistador. 


Esto significa que hemos dejado con alternativas 1, 2, 3, 4, 5, 6, 7, 8, 9, en cada 


columna de la tarjeta perforada para nuestras categorías de respuestas. 
En el sector núm. 1, en el ejemplo, hemos colocado las preguntas, incluyendo algunas 


instrucciones fundamentales limitadas (que aparecen subrayadas). Cuando el 
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cuestionario es administrado por un entrevistador, las instrucciones escritas en el 
instrumento deben ser mínimas, ya que las pertinentes a cada una de las preguntas deben 
ser aprendidas en el proceso de entrenamiento. En el caso de investigaciones extensas 
conviene escribir un Manual para entrevistadores, en el que se especifiquen con el 
mayor detalle características de las preguntas, instrucciones especiales, alternativas, etc. 
En el caso de cuestionarios autoadministrados, el investigador no debe tener ningún 
reparo en abundar en las instrucciones. 

En el sector núm. 2 del ejemplo, encontramos las respuestas, dadas en forma 
“cerrada” o “abierta”. En la pregunta 39 el respondente está limitado en su respuesta a 
tres alternativas. De acuerdo con el resultado de la pregunta, el entrevistador sigue la 
flecha que le indica cuál es la próxima pregunta que debe efectuar. Si los casilleros se 
utilizan para colocar la anotación correspondiente a la respuesta, deben preceder al texto 
de las alternativas. El espacio dejado para la respuesta de una pregunta abierta debe ser 
lo suficientemente amplio. 
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Campo 2 


Сатро 4 


Campo 5 


Veamos lo que sucede en la entrevista que se ha explicado a través de nuestro 


ejemplo: 


Para la pregunta núm. 39 fue escogida la alternativa 2. En consecuencia, pasamos a la 


Sector 1 


“Preguntas” 


. ¿Piensa Ud. que sus in- 


gresos y su estándar de 
vida han aumentado, dis- 
minuido o permanecido 
igual durante los últi- 
mos cinco años? 


. Si han “aumentado” еп la 


pregunta 39, 


¿Qué es lo que ha causa- 
do este aumento? (¿Cuá- 
les son las causas del 2и. 
mento? ) 


. Si han “disminuido” en la 


pregunta 39, 


¿Cuáles han sido las cau- 
sas de la disminución? 


. Al grupo más jóven (na- 


cidos entre 1925-1945). 


¿Piensa Ud. que conti- 
nuará en esta profesión 
o tiene Ud. planes de 
cambiarla por otra? 


. Al grupo de mayor edad 


(nacidos entre 1890-1925) 


¿Qué planes tiene Ud. 
para su vejez? 


Sector 2 | Sector 3 
“Respuestas” | “Código” | 
Г] 1 Aumentado — Pregunta 40 43 
XI 2 Disminuido — Pregunta 41 


Г]З Permanecido — Pregunta 41 


igual 
H 
45-46 
La inflación 
1 Otra — Preguntas 44, 47 
45 y 46 
O 2 La misma — Pregunta 47 
48 


m ee e a a e nmaa ae 


pregunta 41 y dejamos la 40, que no se aplica, marcada con un 0. 


Las anotaciones de O, Y y X pueden colocarse en la línea divisoria entre sector 1 y 
sector 2. Todo lo que aparezca en el sector 3 se hace después de que la entrevista ha 
terminado. Si se sigue esta rutina, es muy fácil para el entrevistador y para el 
investigador que no se pierda ninguna pregunta. Se limita a seguir la línea central y 
encontrará, sin duda, alguna indicación en cada campo. Puede considerarse como 
respuesta a una pregunta abierta, tanto una indicación en un casillero o en un O, X, Y o 
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cualquier indicación escrita. De esta forma, en unos pocos minutos puede verificarse un 
cuestionario entero y podemos estar seguros de que no nos equivocaremos en este 
sencillo modo de controlar. 


Sector 1 


| 
| Sector 2 
| “Preguntas” 


“Respuestas” 


Sector 3 
“Código” 
. Si “otra” еп la pregun- 49.50 

ta 42, 


¿en cuál profesión ha es- 
tado pensando Ud.? 


Campo 1 Venta de seguros 


. Si “otra” en la pregun- 51 

ta 42, 
Мав ¿por qué está Ud. Һа- 
ciendo planes para esa 
profesión en particular? 


. Si “otra” en la pregun- 52 
ta 42, 
Campo 3 
¿cree Ud. que ascende- 
rá en esa profesión? 


. Si “la misma” еп la pre- 53 
gunta 42, 
С 
ша ¿cree Ud. que progresa- 
rá más en su actual pro. 
fesión? 


. ¿Cuántos aparatos de ra- O 1 Ninguno 54 
dio tiene en su hogar? 


Я 2 Uno 
O 3 Dos 


Campo 5 


O 4 Tres o más 


Después de la pregunta 41 el entrevistador, automáticamente, pasa a la 42. La 
respuesta 1 significa que se salta a la 44, pero antes colocará un 0 en el siguiente campo. 

En 45 o 46 el А no supo qué contestar y el entrevistador colocó una Y en el campo. Si 
por alguna razón existe la necesidad de distinguir “Y” en aquellos que no saben 
contestar y los que rehúsan hacerlo, por ejemplo, en preguntas políticas, el entrevistador 
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puede perfectamente anotar “Y ng = no quiere” o “Y ns = no sabe” o cualquier otra 
clave, y esto puede ser perforado separadamente en las tarjetas 51 encontramos que las 
diferencias son de interés. 

Presentamos a continuación algunas secuencias codificadas de otros R en las 
preguntas 39-48. 


Pe satis Ре паба Р мшш РӘ айа 
рти escogida геч escogida gun escogida рен escogida 
39 1 39 3 39 „г 39 3 
40 Y 40 0 40 0 40 0 
41 0 41 0 41 0 41 0 
42 0 42 2 42 0 42 0 
43 2 (moverse a 43 0 43 0 43 Y 

la ciudad) 
44 0 44 0 44 0 44 0 
45 0 45 0 45 0 45 0 
46 0 46 0 46 0 46 0 
47 0 47 E 47 0 47 0 
48 3 48 1 48 3 48 1 


Ejemplo de X еп el Código: Si el R es ciego y la pregunta que sigue se refiere a si ve 
televisión. 


El sector núm. 3 en el ejemplo deberá llenarse tiempo después de que la entrevista ha 
sido efectuada. Este sector posee en cada campo el número de la columna 
correspondiente marcada en la parte superior izquierda del espacio. La parte de la hoja 
que contiene el sector 3 puede ser desprendida del cuestionario y entregada directamente 
al perforador, quien transfiere la información a la tarjeta perforada directamente. Esto 
normalmente tomará mucho menos tiempo que si la información es transferida primero a 
tarjetas especiales y desde ellas tomada y enviada al perforador. 


ESPACIO PARA EL EMPADRONAMIENTO GENERAL EN EL CUESTIONARIO 


El espacio para el empadronamiento general en el cuestionario se hace en la primera 
página y en la última o en algunas de las últimas páginas. En este espacio el 
entrevistador y el investigador registran los datos de importancia para la entrevista. Estos 
datos pueden ser conocidos de antemano, ser obtenidos durante la entrevista o agregados 
después en la comprobación y proceso de codificación. 


La primera página. Veamos un ejemplo de la primera página de un estudio survey: 
(ver grabado p. 81) 

Campo núm. 1. En este espacio aparece toda la información necesaria para la 
localización del respondente en la entrevista, o para una pre-entrevista en el caso de un 
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“panel”. Cada R tiene un número que se le va asignando a medida que se va 
construyendo la muestra. Este número se repite en el Campo núm. 1 y en el Campo núm. 
2. La razón es la siguiente: el investigador puede desprender el Campo núm. 1 de cada 
cédula de entrevista cuando ésta haya sido realizada. Las personas que van a manejar los 
datos a posteriori (codificadores, por ejemplo) no están ahora en condiciones de 
identificar al respondente salvo por un número de código. De esta manera el investigador 
puede tener la seguridad de un alto grado de confidencialidad, sin perder la posibilidad 
de ubicar a sus individuos en cualquier otra ocasión (para ser entrevistados nuevamente, 
por ejemplo). 

Mientras se trabaje con muestras aleatorias, no estamos interesados en los individuos 
per se, de ahí que se garantice la confidencialidad de los respondentes. En las 
investigaciones en las que se contempla un “follow-up” o en situaciones especiales en 
las que se necesita individualizar a los respondentes, será necesario obtener algunos 
datos personales tales como nombre y dirección. 

La cuestión de la confidencialidad tendrá que ser estudiada separadamente, ya que es 
de la mayor importancia para los estudios de este tipo, con el objeto de garantizar un 
correcto manejo de los datos y de los resultados. 

Campo núm. 2. Aquí el entrevistador registra qué ha sucedido con respecto a la 
entrevista. El entrevistador verifica por sí mismo el cuestionario antes de entregarlo al 
investigador y agrega sus comentarios. Es muy importante, en investigaciones de gran 
escala, asegurar que esta operación se realice seria y sistemáticamente. 

Campo núm. 3. Contiene el espacio para anotar los asistentes de la investigación que 
verificaron las entrevistas y el procedimiento de codificación. 

Campo núm. 4. Debe anotarse aquí todo el código “general” usado, en forma visible, 
para que pueda ser consultado fácilmente por el entrevistador. 


Las últimas páginas del cuestionario 


En estas páginas el investigador debe registrar todas las preguntas que el entrevistador 
debe contestar de acuerdo con las circunstancias de la entrevista, tales como: la manera 
en que el entrevistado recibió la entrevista, grado de motivación de la entrevista y grado 
en que el R se encontró en la entrevista y 51 fue o no perturbada por factores del ambiente 
en que se desarrolló, etcétera. 
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„m a A A. A A A TA TA. A A. A A A A A A шшш "шшш чыш A A A A e ш + 


CUESTIONARIO 


Encuesta nacional de .... 197... 
(título de la investigación) 
Institución Sociológica de 


& эё, ETA TE Y E OR ISA E OO TEO E A OA әтәс 


Campo 1 


Detalles del nacimiento, dirección, nacionalidad, etc, 
Detalles de la muestra, núms. de registros, etc. 
Apellidos del R Nombres 


PP A A AA A — A _——-++——‚—— ——————-—-— ———  —-—-—-—-— -—— 


Nombre del entrevistador Núm; id: oz Entrevistado núm. 


Tiempo de la 

entrevista 
Desde las .... alas .... horas. Fecha: .......... 197. 
Desde las .... alas .... horas. Fecha: .......... 197. 


Tiempo total de la entrevista: 


Campo 2 


minutos 
La entrevista 
completa 


Número de llamadas 


. «+. (incluyendo la ocasión en que fue 
efectuada la entrevista) 


Incompleta, ЧаНнадйо TO. SENS ¿ii SARA REA 


Entrevista controlada рот: .............. 
Comentarios: 


........................................ +... « э ө ө ө ө + ө +. 


a. eee. enn” »s ono... .e. э @\ө өФУ®'@-ө ө э.ә.ә фә @'ф Ф: Ф Фо э өөө .©:Ф-Ф7@ 4:9 ө-'ә өө өэ. ® Фә 'ф Фф Ф''эФ o. 


Esta entrevista fue hecha el 1, 2, 3, 4, 5, días o después. 


Campo 3 


an AA 
Codificada hasta: 

Codificación controlada: 
Comentarios: 


O ET O фаре е OS A ON AA AA Y dd di 


о ета > A RIA A AAA AAA AAA AAA алаар уе 


Código: 


O = según las instrucciones, esta pregunta no se aplica. 
ТҮ: к= 


se hizo la pregunta al R, pero no quería contestar o no sabía contes- 
tarla (en una manera codificable). 


no se hizo la pregunta al R, por no estimarlo conveniente el entre- 
vistador. 


Х = 


Сатро 4 


Institución Sociológica de .......... Й...» 
Confidencial 


Presentamos un ejemplo de una de estas páginas: 
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(Estas preguntas son las últimas del entrevistador 
al entrevistado.) 


. ¿Le agradó contestar las pre- 
guntas de este cuestionario? 


‚ ¿Sele ha ocurrido ahora algo 
especial con respecto a la en- 
trevista y que no tuvo opor- 
tunidad de mencionar antes? 


. ¿Había escuchado algo acer- 
ca de esta entrevista antes 
que llegara nuestra carta? 


. ¿Ha sido Ud. entrevistado O Sí. — Pregunta 81. 
en oportunidades anteriores? O No. — Fin. 


‚ ¿Acerca de qué fue entre- 
vistado anteriormente? 


Puede ser recomendable que el investigador agregue algunas páginas en blanco al 
final del cuestionario, en las cuales el entrevistador presente su “informe” acerca de la 
entrevista. Esto es: cómo fue recibido y en qué forma continuó la entrevista. Este 
informe es un documento valioso para el investigador, por las siguientes razones: 


— Es una excelente manera de conocer las actitudes del А con respecto a la 
investigación. 

— El investigador puede juzgar la calidad del entrevistador (E), y controlar casos de 
falsificación total o parcial de la entrevista. 

— Si algunas partes del cuestionario faltan, la razón de ello puede ser encontrada, 
seguramente, en el informe. 

— El informe puede, incluso, servir muchas veces como una ayuda en la 
categorización de alternativas de respuestas de algunas preguntas abiertas. 

— Hacer de cada entrevista un “caso más científico”, acentuando en el Е la necesidad 
de un buen entrenamiento teórico y práctico en materia de entrevistas. 
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Las siguientes preguntas deben ser contestadas por el entrevistador inmediatamente 
después que la entrevista ha sido Nevada a cabo (pero después que el entrevistador 
ha dejado al R). 


. ¿El cntrevistador y el cntre- O Sí, estuvieron todo el tiempo en una pie- 
vistado estuvieron solos du- za aislada. 
rante la entrevista? O No, otra persona estuvo presente todo el 
tiempo, pero no interrumpió. 
O No, otra persona estuvo presente parte del 
tiempo, pero no interrumpió. 
Г] No, otra persona estuvo presente e inte- 
rumpió algunas veces. 


. Si el entrevistador y el entre- O Si, hubo influencia sobre varias partes de 
vistado no estuvieron comple- la entrevista. 
tamente solos. 


¿Cree Ud. que las respuestas 
fueron influidas por la presen- 
cia de otra persona? O No hubo influencia. 


. Si no fue posible continuar 
la entrevista. 


¿Por qué razón no se pudo 
continuar la entrevista? 


. ¿Cuántas visitas realizó al do- La entrevista se realizó en la 
micilio del entrevistado antes visita. 
de poder comenzar la entre- 
vista? 


. La actitud del entrevistado Г] Миу interesado. 
ante la entrevista fue: O Interesado. 

O Algo interesado, 

Poco interesado. 

No interesado. 


O 
O 
. El contacto con el entrevista- O Muy bueno. 
do fue: O Bueno. 
O Ni bueno ni malo. 
O Algo malo. 
O Malo. 


— Es un instrumento descriptivo valioso con respecto a algunas actitudes generales. 
(Por ejemplo, en el caso en que el entrevistador haya anotado aquí lo que R tiende 
a conversar cuando no se le está preguntando.) 


DIFERENTES TIPOS DE PREGUNTAS 
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En esta parte, trataremos de mostrar algunas preguntas estándar у cómo pueden ser 
introducidas fácilmente en un cuestionario. 


La pregunta cerrada 


La pregunta cerrada “simple” 


Tal como definimos, cualquier pregunta para la cual las posibilidades de respuestas están 
limitadas a dos o tres alternativas es una pregunta cerrada simple. Un ejemplo de 
pregunta “cerrada”: 


49. ¿Trabaja Ud. actualmente? 


Ventajas. Muy fácil para registrar, interpretar, codificar y analizar, no necesita 
entrevistadores altamente entrenados. 

Desventajas. Su forma impide una clasificación más fina. Las respuestas que se 
encuentran, justamente, en el borde de dos alternativas tienden a ser forzadas en alguna 
de las dos categorías. Este tipo de preguntas tiene que ser seguido por aclaraciones en las 
instrucciones dadas al entrevistador. Por ejemplo: ¿qué se considera como trabajo? 81 
una persona jubilada trabaja diez horas semanales, pero considera esto como una especie 
de ocupación de tiempo libre, ¿cómo lo clasificaría en las categorías dadas en la 
pregunta 49? A menudo al entrevistador se le suscita el siguiente problema: “Yo no sé. 
He trabajado durante dos semanas, pero esto no es en forma regular”. En este caso, el R 
tiene que escoger entre si considera que coincide más con el tipo de “trabaja 
actualmente” o el de “actualmente no trabaja”. 

Una generalización como ésta es, muchas veces, muy difícil de efectuar, pero el 
investigador debe tener claro este tipo de problemas con el fin de homogeneizar las 
instrucciones a sus entrevistadores, evitando en todos los casos que sean ellos los que 
tomen este tipo de decisiones. 


La pregunta “cerrada” con múltiples respuestas 


La pregunta con múltiples respuestas es vulgarmente llamada pregunta de “cafetería” por 
su semejanza con la situación que se produce en algunos lugares donde el cliente tiene 
que escoger entre varias alternativas de platillos o bebidas. Un ejemplo de una pregunta 
tipo “cafetería”: 
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53. ¿A qué hora del día parte 
Ud. de su hogar para ir a 
su trabajo (escuela)? Indi- 
que la hora con una preci. 
sión de hasta 5 minutos (por 

ejemplo: 0.55). 


. Los lunes parto de mi casa а las .... 
Los martes, a las .... 
Los miércoles, a las .... 
Los jueves, a las .... 
Los viernes, a las .... 
Los sábados, a las 

Los domingos, a las .... 
O 2. Mi horario de salida no sigue los dias 
de la semana (pase a la pregunta núm. 


3 


Г] 3. No parto para mi trabajo a una hora 
especial. 
ы iria rs ir 
Г] 4. Realizo mi trabajo en el hogar, 
El entrevistado es 
O 5. No tengo ninguna profesión y no voy 
a la escuela. 
El entrevistado es ......... 
Г] 6. Esposa que es ama de casa. 
е AN 


El R tiene que escoger una o más alternativas en una pregunta de “cafetería”. En el 
último caso, hablamos de “múltiples alternativas” o de “código múltiple”. Esto complica 
de inmediato el análisis de la situación, requiriendo entrevistadores bien entrenados. 

Ventajas. La pregunta de “cafetería” tiene más posibilidades de respuestas que la 
pregunta cerrada con dos alternativas y por eso da la oportunidad de ampliar la 
información. Es fácil de codificar y analizar en su simple forma. 

Desventajas. En muchas ocasiones es difícil obtener la categoría de respuesta 
adecuada. En el pretest, las preguntas de “cafetería” tienen multitud de veces la forma de 
preguntas “abiertas” que se analizarán y clasificarán en las alternativas buscadas. 
Muchas respuestas pueden complicar el análisis de la pregunta. 

También es posible desechar algunas alternativas, si la respuesta no cae dentro de las 
categorías dadas. En este caso, la pregunta podría tener un “final abierto”, esto es, una 
alternativa “otro” (en el código anterior: núm. 7) y algún espacio para escribir una 
explicación. Esto acrecienta la calidad de las respuestas pero las hace, a la vez, un poco 
más complicadas para ser analizadas. En el pretest esta solución es muy común, cuando 
el investigador no está totalmente seguro de las posibles alternativas. 


Técnicas especiales: hojas sueltas 


Cuando la pregunta de “cafetería” tiene muchas alternativas, lo que provoca dificultad 
para su lectura y puede ser olvidada por el R, el entrevistador puede mostrar una página 
que incluye dichas alternativas. En especial si a cada ítem le corresponde una serie de 
categorías que deben ser elegidas, como en el caso de una escala. Las páginas que se 
muestran al R no deben tener ninguna anotación correspondiente al código o que pueda 
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confundir al R en alguna forma. Por ejemplo, que pueda pensar que alguna categoría es 
mejor que otra. Indistintamente, puede darse una página a cada uno de los 
entrevistados, o bien la misma puede mostrarse a todos. 

En el primer caso, el R puede marcar con un lápiz las alternativas que escoja. El 
entrevistador lee las alternativas al R hasta estar totalmente seguro de que éste ha 
comprendido perfectamente el procedimiento. Sin embargo, las anotaciones se hacen en 
la página correspondiente en el cuestionario por el entrevistador. Ésta es la copia exacta 
de la página que se muestra al entrevistado, pero tiene marcas de código en ella. Las 
anotaciones que valen son las del cuestionario; la hoja suelta sirve como una ayuda 
solamente. Aquí hay un ejemplo de un “perfil de intereses”, hecho en forma de escala 
“Lickert”. La hoja en el cuestionario: 


77. Ahora bien, aquí hay otras preguntas sobre sus intereses. Por favor, señale entre las actividades que yo 
lceré cuánto le gusta cada una de ellas. 


gusta | poco 
ra 2 


Me gusta | Me gusta 
muc 


mucho hísimo 


2 
2 


3 
3 


2 


[ЖГ ЖИЕН 


19. Tomar parte en asociaciones o clubes 


2 


En el segundo caso (la página suelta se mostrará a todos) se recomienda plastificarla, 
tratando en lo posible que sea pequeña y fácil de manejar. A continuación damos un 
ejemplo en el cual R tiene que poner en orden siete alternativas: 


350 
IE ан 
эш и 
EA 
Җа жы 
¿ME 


4 


20. Escuchar la radio 


96 


72. ¿En qué sectores cree Ud. 
que el gobierno debe inter- 
venir más? ¿Podría Ud. or- 
denar las siguientes tarjetas 
de sectores colocando en 
primer lugar aquel sector 


Educación 

Industria 

Mincría 

Prensa 

Religión 

Salud 

Compañías extranjeras 


en que el gobierno debería 
intervenir más? 


DoOoDODODO 


Ordenar tarjetas sueltas. 
Poner número de rango. 


Se le presentan siete tarjetas pequeñas con alternativas y se le ruega ordenarlas desde 
la más alta a la más baja. 


Religión Minería 
Salud Prensa Compañías extranjeras 


Esta técnica especial acrecienta la validez y confiabilidad de las preguntas que se 
efectúan y además constituye una interesante ruptura en la rutina de R, que lo acerca al 
problema resolviendo tareas. 


La pregunta abierta 


Un ejemplo de una pregunta abierta: 


56. ¿Piensa Ud. que hay algo en 
la sociedad con lo cual Ud. 
no está de acuerdo, algo que 
Ud. desea cambiar? 


(Follow-up. Preguntas “adi- 
cionales” о “clarificadoras”.) 


En la pregunta “abierta” el número de alternativas de respuestas posibles es 
prácticamente infinito. En algunas ocasiones R tiene mucho que decir y continuará con la 
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respuesta alrededor de unos 10 minutos; en otros casos, tiene dificultad para decir algo. 
La habilidad del entrevistador es importante en las preguntas “abiertas”. Casi siempre el 
entrevistador hace un follow-up, es decir, pone preguntas adicionales o preguntas que 
pueden clarificar más la respuesta. Es muy difícil obtener del R que diga más sobre 
alguna materia sin interiorizarse más en la conversación. Y si el entrevistador tiene que 
efectuar las preguntas del follow-up, tiene que asegurarse primero de maniobrar la 
técnica de la entrevista, de tal modo que no haga preguntas directivas о preguntas 
ambivalentes. 

Ventajas. Buena comprensión de los motivos y grado de compromiso del R. Mejor 
contacto entre el R y el entrevistador. Incremento de la motivación para la entrevista. 

Desventajas. En algunas ocasiones, dificultad de parte del R para contestar cuando no 
tiene la respuesta lista. Compare el caso de la pregunta de “cafetería” donde obtiene la 
ayuda con ciertas clases de respuestas de las preguntas. Dificultad para las anotaciones e 
interpretaciones. Dificultades para clasificar las categorías para el código. Necesidad de 
entrevistadores bien entrenados, lo que aumenta el costo del estudio. En algunas 
ocasiones, los prejuicios del entrevistador pueden influir fácilmente en las respuestas. 

La pregunta “abierta” es usada de preferencia en el pretest cuando el investigador no 
conoce con certeza las posibles categorías de respuestas. Pero las preguntas “abiertas” 
son también usadas en el estudio final, especialmente como las últimas que se colocan en 
una batería de preguntas para obtener, así, un análisis más profundo. 

Las diferentes respuestas de las preguntas “abiertas” deben ser codificadas en un 
número de categorías, con el objeto de poder analizarlas cuantitativamente. Esto, algunas 
veces, puede constituir una tarea difícil. La confiabilidad en la manera que codifiquen 
los codificadores tiene también que ser verificada, en el sentido en que no exista 
ambivalencia o falta de claridad dentro de las categorías. Esta confiabilidad debe tener 
un puntaje de correlación mínima de .90 en cualquiera de dos codificaciones realizadas 
que se tomen. A continuación, presentamos un ejemplo con una pregunta abierta con su 
código lateral respectivo: 


57. ¿Cuáles son, a su juicio, las 
principales éticas que un pro- 
fesor contemporáneo debe 
tratar de desarrollar en sus 
alumnos? 


Indique la cualidad más im- 
portante. 


Un ejemplo de codificación de “preguntas abiertas” es el método que se llama 
“codificación en el campo”. La ventaja aquí reside en que el entrevistador puede estimar 
directamente los sentimientos acerca de la pregunta y codificarlos en categorías 
establecidas. Naturalmente, hay que tener mucho cuidado porque es fácil introducir 
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sesgos por parte del entrevistador. Éste puede equivocarse, por ejemplo, al juzgar al R 
por algunas razones ajenas a la contestación de la pregunta, como su manera de vestir, de 
hablar, etcétera. 


Código 


Pregun- ат Alternativas de respuesta 
ta núm. А 
57 62 1. Superación у alegría: espontaneidad, felicidad, curiosidad 
por saber, creatividad, honestidad, confianza en sí mismo, 
autonomía 


2. Uso racional de la energía: celo, aptitud, tenacidad 

3. Habilidad activa para adaptarse a situaciones sociales: so- 
ciabilidad, cooperatividad, camaradería 

4. Habilidad pasiva para adaptarse a situaciones sociales: auto- 
control, autodisciplina, comportamiento perfecto, pulcritud, 
limpieza, tolerancia 

5. Habilidad para ajustarse a personalidades autoritarias: res- 
peto por la autoridad, profesores y mayores, subordinación 
de los sentimientos al deber 

6. Ajuste autosustentado a situaciones sociales: deseo de com- 
petencia, ambición 

7. Amistad, amor, tolerancia, buen corazón 

8. Lealtad a los valores existentes: honestidad, sentido de lo 
bueno y lo malo 


9. Importancia personal, valentía, honestidad 


Damos a continuación un ejemplo de una pregunta abierta, en la cual el entrevistador, 
además de escribir la respuesta en el espacio vacío, tiene que hacer una codificación en 
el campo acerca del grado de relación (favorable-desfavorable) entre profesores 
universitarios y profesores secundarios. Nótese que el entrevistador no lee las 
alternativas presentadas en el sector de las respuestas. 


38. ¿Cuán buena es, en su con- 
junto, la relación existente 
entre profesores universita- 
rios y profesores secunda- 
rios como grupos profesio- 


nales? O Muy buena. 
O Bastante buena. 
O Buena y mala. 
O Bastante mala. 
O Muy mala. 
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La utilización de preguntas cerradas y abiertas, en conjunto. 
Ejemplo de un “código múltiple” 


Como hemos mencionado en el caso de preguntas tipo “cafetería”, la posibilidad de 
seleccionar más de una alternativa entre muchas puede complicar el análisis de datos. 
Este tipo de respuestas las hemos llamado “código múltiple”. La construcción de tales 
preguntas puede involucrar bastantes problemas. 

Presentamos en seguida un ejemplo de cómo se resuelve el problema con alternativas 
múltiples, utilizando diferentes tipos de preguntas. Supongamos que queremos poner 
unas preguntas acerca de la percepción de medios de comunicación de masas (“mass 
media”). Empezamos con los diarios y preguntamos acerca de cuál periódico es más 
leído por los R. 

Ahora bien, es posible que R lea: ninguno, uno, dos o más. Deseamos, asimismo, 
preguntarle la frecuencia con que lee los diferentes diarios en el caso de que lo haga y, 
en especial, qué parte del periódico prefiere. Todo esto debe estar dividido en su orden 
lógico en el cuestionario, con el objeto de que no sea demasiado complicado. 

En primer término, ¿sobre cuántos periódicos preguntaremos? Evidentemente, sobre 
uno como mínimo. Dos periódicos sería mejor todavía, si se trata de una persona que le 
gusta estar bien orientada en cuanto a noticias y que probablemente lee dos en forma 
detallada. Existirá una diferencia en percepción de la comunidad, naturalmente, entre las 
personas que leen uno y las que leen dos diarios, con respecto a sus conocimientos 
políticos, por ejemplo. Mucho más con alguien que lee y se documenta a través de tres 
diarios. Podrían, incluso, existir diferencias entre quien lee dos diarios y quien lee tres. 
Luego seguimos con quienes leen cuatro, etc. Evidentemente, mientras mayor sea el 
número de diarios escogidos, menor será el porcentaje de R a los que atañe la categoría y 
menor la diferencia en percepción de la comunicación, digamos, entre las personas que 
leen 5 y las que leen 6 periódicos. 

De esta manera, a través de nuestro pretest hemos encontrado en una pregunta 
“abierta” que muy pocas personas leen 3 y más diarios, pero que existe una diferencia 
apreciable en conocimientos políticos, por ejemplo, entre los que no leen ninguno, y los 
que leen uno o dos diarios en una proporción más o menos clara. Consecuentemente 
decidimos preguntar solamente acerca de dos como máximo. 

Segundo, ¿de qué manera seguiremos preguntando? Empezaremos por preguntar qué 
diario lee el R; en seguida, qué es lo que lee del diario y, finalmente, con qué frecuencia. 

Tercero, ¿qué clase de preguntas colocaremos: abiertas, cerradas, etcétera? 

El ejemplo desarrollado en las dos páginas siguientes puede ser una solución. 

Hemos presentado una solución al problema de obtener información acerca de la 
exposición y percepción de medios de comunicación masivos, utilizando los tres tipos de 
preguntas presentados anteriormente: cerradas simples, cerradas con respuestas múltiples 
y abiertas. 
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59. ¿Lee Ud. diarios o revistas? 1. 0 St. 
2. D Мо —— 66 
60. ¿Cuál es el diario que lee Excelsior. 
más? Últimas Noticias. 
Novedades. 


El Sol de México. 
El Universal. 
E! Heraldo. 


:© сора Nas гәр 
ARO 


..o.... .........o.... э» 


. 0 No lee otro. 

‚ Г] Excelsior. 

Г] Últimas Noticias. 
O Novedades. 

. Г] El Sol de México. 
O El Universal. 

. O El Heraldo. 


61. ¿Ud. lee también otro dia- 
по? ¿Cuál? El дие R lee 
en 2° lugar. 


о оом ул ФЬ у о © 


. Ud. ha dicho que lee el 


O Todos los días (5-7 días de la semana). 
DARA lo hace: 


O Algunas veces por semana (2-4). 
Г] Una vez por semana (1). 

[] Algunas veces al mes (1.3). 

O Casi nunca. 

O Otro. 
RA шы сижи зш ы» 


. ¿Qué partes en particular le 
gusta leer en él .......... 
coordina ? Mencionar 
primer diario. Follow-up. 
Código múltiple. 


En general, esta manera de presentar las preguntas evita interpretaciones ambivalentes 


y las hace más fáciles de registrar, al ordenar los diferentes campos de preguntas, con 
arreglo a la manera lógica de pensar primero en el área más grande (si lee o no diarios), 
después preguntando por campos más restringidos y así sucesivamente. 
Aunque en el ejemplo es claro que habrá algunas dificultades en la categorización de 
las preguntas abiertas, podremos no obstante obtener un conocimiento más profundo de 


qué significa para el R leer diarios. Para algunos R, leer el diario puede significar leer 


solamente ciertos rubros; para otros puede significar leer en partes o leerlo en su 
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totalidad. 


64. Ud., ha dicho que también Todos los dias (5-7 días de la semana). 
- Algunas veces por semana (2.4). 
lo hace: Una vez por semana (1). 
Algunas veces al mes (1.3 veces al mes). 
Casi nunca. 
Otro. 
¿Cuál? ..... 


‚ ¿Qué partes en particular le 
gusta leer en el 
? Mencionar 
Segundo diario. Follow-up. 
Código múltiple. 


66. ¿Ud. lee revistas? 


Ejemplo de preguntas encadenadas 


A veces, se puede utilizar una serie de preguntas con el objeto de obtener un 
conocimiento más profundo de la situación, y también pueden ser usadas para forzar al R 
a clarificar su posición. Presentamos a continuación las siguientes preguntas: 


70. Si Ud. tuviera que definir . O Muy interesado, 
su interés en los asuntos po- . 0 Algo interesado. 
líticos, ¿Ud. diría que está . Г] No muy interesado. 71 
muy interesado, algo intere- . Г] Otra respuesta: 
sado, o no muv interesado? 


71. Si contestó: “No muy inte- . О Un poco interesado. 
resado” a la pregunta 70: ‚ [1 Nada interesado, 


¿Está usted un poco intere- 
sado o no le interesa nada? 


Muchos respondentes han contestado en la categoría 3 sobre la pregunta 70. En la 
nueva pregunta, su intención con la respuesta “No muy interesado” es dividirla en dos 
nuevas categorías: “Un poco interesado” y “Nada interesado”. De esta manera hemos 
conseguido un refinamiento de la escala, en un espacio de la continuación obligada. 

La misma idea se ha empleado en la pregunta siguiente (72). Primero, el respondente 
ha sido interrogado sobre si está o no de acuerdo. Esto es, un terreno alternativo entre la 
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alternativa 1 y 2 о 3 y 4. Luego, dentro de cada categoría, ha sido interrogado sobre el 
grado de aprobación o negación. 

De esta forma, hemos omitido un O en la escala, en el cual muchos entrevistados 
tienden a concentrarse, ya que es más fácil dar una respuesta que no constituye una 
afirmación exacta. 

La pregunta entonces sigue y trata primero de explicar los motivos de la actitud y 
finalmente la importancia que tiene para R. Con esto, hemos cubierto la parte más 
esencial referente a la opinión necesitada. 


72. En muchos países en los cua- . No pena de muerte 
lcs existe la pena de muer- (completamente convencido). 
te se discute si debe ‚ No pena de muerte 
mantenerse o ser abolida. (convencido en forma general). 
¿Cuál es su opinión al res- . Pena de muerte 
pecto? ¿Está Ud. comple- (convencido en forma gencral). 
tamente convencido de ello, . Репа de muerte 
o sólo piensa que así debe (completamente convencido). 
ser en general? Otra respuesta: 


(Escriba la respuesta 
palabra por palabra.) 


¿Podría explicar los motivos 
de su actitud ante esa pre- 
gunta algo más en detalle? 


(Escriba la respuesta pala- 
bra por palabra.) 


Para posibilitar la obtención de toda esta información de manera óptima, hemos 
utilizado diferentes tipos de preguntas en las baterías. La pregunta 72 tiene, por ejemplo, 
en su primer paso, el carácter de ser una pregunta cerrada simple. La ventaja en este caso 
es que existen solamente dos tipos de respuestas y la persona no puede escapar a una 
categoría media más “conveniente”. El segundo paso de la pregunta 72 es una pregunta 
tipo “cafetería”, si vemos la pregunta en total globalmente. Aquí obtenemos el grado de 
aceptación o rechazo. 

Finalmente, a fin de obtener las explicaciones de los motivos, hemos utilizado una 
pregunta abierta para asegurarnos una penetración profunda del problema. 


Preguntas particulares 


En seguida presentamos preguntas aplicadas a diferentes campos de información muy 
utilizados: 
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La pregunta de ingresos 


Ejemplo de una pregunta sobre ingresos: 


73. Cuánto gana Ud. mensualmente 
en total. 


. Menos de 1 250. 

Más de 1250 menos de 1 500. 
Más de 1 500 menos de 1750. 
Más de 1750 menos de 2 000. 
Más de 2000 menos de 2 500. 
Más Яс 2 500 menos de 3 000. 
Más de 3000 menos de 3 500. 
Más de 3 500. 


] 

2. 
а, 
4. 
$; 
6. 
г А 
8. 


Si vamos a estudiar la distribución de ingresos del país о de la población y nos es 
desconocida, podremos obtener una idea en el pretest, que puede llevarnos a las 
presentes categorías de respuestas (ver ejemplo). La distribución de ingresos está 
sesgada hacia el lado de los menores ingresos. Esto tiene que ser representado en las 
alternativas de respuesta. Una pregunta como ésta debería ser seguida de otras en las que 
se pregunte cuántas personas viven de ese ingreso, si existen otras fuentes extras de 
ingreso u otros beneficios. En algunas ocasiones, el jefe de la familia (el único que gana 
dinero) no coincide con el entrevistado, etcétera. 


Preguntas sobre ocupación 


Estas preguntas debieran ser también elaboradas, de modo que no se presten a 


confusiones, ya que existen trabajos diferentes que llevan la misma denominación.? 


74. ¿Cuál es su ocupación? 1. O No trabajo porque: | 


(¿En qué trabaja 042) 


POLA AUDACIA AAA @ 


Agregar una descripción sobre 
lo que está haciendo en su 
trabajo. 


75. ¿En dónde está empleado 
usted? 


1. Г] Empleador. 
li LA КОРДО ЕН rra 
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Por ejemplo, alguien se define a sí mismo como “pintor”. Puede tratarse de un artista, 
un empleado o empleador de una fábrica de pinturas. A menudo se puede estudiar la 
movilidad ocupacional a través de una batería de preguntas de este tipo, agregando 
preguntas sobre la ocupación del padre y de los hijos. Un ejemplo de preguntas sobre 
ocupación se ve en la p. 109. 


Preguntas sobre conocimientos 


Finalmente presentaremos algunos ejemplos de cómo medir el conocimiento (en este 
caso, el conocimiento político en un cuestionario). Ejemplo de preguntas para verificar 
conocimientos políticos: 


76. ¿En cuál campo se han desta- 
cado las personas que se indi- 
can a continuación? 


1. Béla Bartók 
2. Wernher von Braun 
3. William Faulkner 


6. Carl Nielsen 
7. Sékou Touré 


8. Н. С. Urey 


4. Alexander Fleming 
5. Heinrich Himmler 


Los entrevistadores leen las alternativas una por una o muestran una hoja que las 
contiene. Una respuesta equivocada puede ser anotada con un signo — y una respuesta 
correcta, con el signo +. 

En estas preguntas hay que tener un cuidado extremo de cada detalle: en la pregunta 
77, una respuesta correcta se anota con el signo +, y una respuesta equivocada con el 
signo —. ¡Cuidado! La mitad de los números de los ítems puede ser falsa, es decir, el 
investigador puede introducir algunos ítems sobre personas o sucesos inexistentes, para 
probar la confiabilidad de las respuestas. 

En la pregunta 78 no se presentan alternativas y el entrevistado tiene que conocer 
bastante bien el área para poder responder. Tiene la desventaja de que desecha los 
individuos que tienen algunos conocimientos pero no los suficientes para recordar 
exactamente las respuestas correctas. Una dificultad estriba también en la interpretación 
de algunas respuestas medio correctas. 
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77. ¿De cuáles de los sucesos si- 
guientes se ha enterado Ud.? 


Mostrar hoja suelta. 


(Ninguno sucedió antes de 
1973.) 


Marque con una X en el 
cuadro indicado. 


1. Nixon renuncia a la presi- 
dencia de los Estados Uni- 
dos. 


2. La India explota su prime- 
ra bomba atómica. 


3. China Comunista compra 
trigo a Canadá. 


4. Asesinan a Carlos Pratts en 
Argentina. 


5. Escándalos de espionaje en 
Alemania del Oeste causan 
la renuncia de Willy Brandt. 


Me he No me he 
enterado enterado 


6. Juan Perón muere y su es- 
posa lo sucede en la presi- 
dencia de Argentina. 


7. Caetano derrocado por los 
militares portugueses. 

8. El huracán Fifí destruye la 
economía de Honduras. 


9. Los países productores de 
petróleo suben los precios 
del crudo. 


10. El director de la cia decla- 
ra que USA interviene en 
el derrocamiento del presi- 

dente Allende, en Chile. 


11. Valery Giscard D'Estaing es 
elegido Presidente de Fran- 
cia. 
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. ¿Podría Ud. decir el nom- 
bre del secretario de Edu- 
cación? 


. ¿Conoce Ud. el nombre 
del lider del Partido Acción 


Nacional? | 


. ¿Conoce Ud. a cuál раг. 
tido político representa el 
presidente de los Estados 
Unidos? 


4. ¿Podría nombrar el partido 
político al cual los siguien- 
tes periódicos representan 
o con el cual simpatizan? 
Excelsior, El Universal, 

El Día. | 


. ¿Los siguientes nombres, 

le significan algo a Ud.? | 
Carlos Andrés Pérez, 
Velasco Alvarado, 

Hugo Vanzer. | 


. ¿Ha visto Ud. alguna vez 

las siguientes abreviaturas 

y podría Ud. mencionar el 

significado que tienen? 

O.I.T., | 
NAFINSA, | 
C.T.M. 


«¿Sabe Ud. cuántos di- 
putados tienc el Congreso? 


Las preguntas 76 a 78 se presentan para ser aplicadas a los estudiantes universitarios. No 
puede aplicarse a la población en general pues son bastante difíciles. 


“LISTA DE CONTROL” PARA CUESTIONARIOS Y ENTREVISTAS 


En las siguientes líneas tratamos de presentar tres “listas de control”:* una para la 
construcción del cuestionario, una para el cuestionario y las baterías de preguntas y una 
última que se refiere al cuestionario y a la entrevista. 
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Una “lista de control” para la construcción del cuestionario 


1. Escriba el texto de la pregunta lo más simple posible. La pregunta puede ser muy 
comprensible para la persona que la escribe. En muchas ocasiones el investigador 
emplea un lenguaje demasiado complejo en su tarea diaria y en su conversación 
profesional con el entrevistado. Intente hacer más accesible el lenguaje dejando de lado 
las palabras abstractas, el “lenguaje científico” y términos como “nivel de educación”, 
“movilidad”, “percepción”, etcétera. 

2. La pregunta no debe contener más de 25 palabras. Mientras más corta, mejor, 
siempre que su contenido no sufra. La pregunta debe expresarse de tal modo que no 
necesite ninguna explicación adicional de parte del entrevistador. 

3. La pregunta debe contener una sentencia lógica. Si mezclamos dos sentencias 
lógicas, la pregunta es ambigua. Ejemplo: “Los profesores son justos con los estudiantes 
que están de acuerdo con sus ideas e injustos con los estudiantes que no lo están”. Un 
acuerdo con esta sentencia puede implicar acuerdo con dos juicios о acuerdo con uno de 
ellos que parezca predominante, pero no sabemos con cuál. Es recomendable convertir 
en dos preguntas ésta que acabamos de mencionar en el ejemplo. 

4. Evitar las preguntas ambiguas. Ejemplo: “Las mujeres son capaces de todo”, puede 
tomarse en el sentido positivo o en el negativo que encierra la frase. 

5. Evitar el uso de estereotipos o de palabras cargadas emocionalmente. Ejemplo: “La 
mujer es sólo una variante inferior del género humano”. 

6. Evitar preguntas dirigidas. Esto es, preguntas cuya respuesta esté sugerida al 
entrevistado. Ejemplo: “a) La razón de la sequía es la falta de agua; b) ¿No cree usted 
que existe un alto grado de inflación en este país?” 

7. El investigador debe decidir si personificará las preguntas o no. Esto depende de la 
gente con la cual va a trabajar. En la mayoría de los casos es recomendable personificar 
las preguntas. Cuando el contenido de la pregunta no es socialmente aceptado, la 
pregunta no debe ser personificada, ya que puede conducir a un rechazo. 

8. Decidir en qué sentido, deseado o no, modificará las respuestas el empleo de 
nombres de personajes. Se ha visto que, en la medida en que el sujeto no conoce la 
opinión del personaje sobre el problema planteado, responderá según la simpatía o 
antipatía que éste le cause. Ejemplo: “¿Aprueba o desaprueba usted las ideas de Carlos 
Marx sobre los obreros?” 

9. Para el fenómeno de la deformación conservadora, una tendencia a la desconfianza 
o temor al cambio: 


Para la desconfianza. Enunciar las preguntas de manera tal que los acuerdos o 
desacuerdos no estén en un mismo nivel respecto de la opinión. Vale decir que a 
veces estar en favor de algo implique rechazar la sentencia, y otras aceptarla. 
Ejemplo: “Los capitalistas en conjunto son un grupo de gente decente”. 


Completamente De acuerdo Indeciso En Completamente 
de acuerdo desacuerdo en desacuerdo 
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Para el temor al cambio. Deben formularse las preguntas de manera tal que, si se 
proponen modificaciones de las normas vigentes, sea aparentemente menos violento.* 
Ejemplos: “¿Es usted partidario de interpretar legalmente la Constitución de manera 
que se impida...?” ¿Es usted partidario de modificar la Constitución de manera que 
se impida...? En este caso, la segunda formulación es más atrayente para un rechazo 
proveniente del temor de reconocer una tendencia al cambio. La primera es 
preferible. 


10. Evitar una pregunta que parezca poco razonable o inoportuna, empleando una 
breve justificación introductoria de por qué la incluimos. 

11. Evitar preguntas que requieren mucho trabajo de parte del informante, para evitar 
la fatiga, y también, a veces, errores de memoria. Ejemplo: “¿Cuáles han sido sus 
ingresos mensuales desde 1950 a 19707?” 

12. Ligado a lo anterior, si nuestra pregunta tiene una larga lista de alternativas 
(pregunta de “cafetería”), para el caso de la entrevista (respuesta oral a estímulo 
auditivo), es preferible acompañar la pregunta con la lista de respuestas alternativas en 
una tarjeta que el informante pueda tener presente. 

13. En general, sin embargo, es preferible no dar largas listas de alternativas, y aún 
menos si éstas son dificiles de recordar durante la entrevista. Si se le dice: “Ante esto, 
usted prefiere... 1..., 2..., 3..., 4..., 5..., 6..., 7..., etc.”, cuando acabamos de leer la 
lista, el sujeto ha olvidado nuestras alternativas. En realidad estamos jugando con datos 
cargados. 

14. Si nuestra pregunta contempla un ordenamiento de las alternativas ofrecidas, es 
preferible imprimir cada alternativa en tarjetas separadas que el sujeto pueda manipular y 
ordenar a su gusto. 

15. Para las preguntas abiertas, deberá dejarse amplio espacio con el objeto de anotar 
las respuestas. 

16. En general, las alternativas a nuestras preguntas (en el caso de emplear este 
sistema) deben ser formuladas en base a un análisis de las respuestas dadas por los 
sujetos del pretest cuando se les preguntó sobre el tema, sin ponerles ninguna restricción, 
de manera abierta. Extraeremos las alternativas de entre las respuestas espontáneas más 
frecuentes y realistas. En suma, la formulación de las preguntas debe garantizarnos el 
logro de los objetivos básicos en el empleo de este tipo de estímulos en la investigación: 
a) Validez: que las preguntas den cuenta del fenómeno que estudiamos; Б) 
Discriminación: que nos permita discriminar subgrupos entre los R; que obtengamos 
respuestas en diferentes sentidos; si todos coinciden, poco uso le daremos al ítem. 

Por último, recordaremos nuevamente que, si entre los datos o variables que 
queremos estudiar anotamos actitudes (ideológicas y otras variables de un nivel de 
organización superior al de las simples opiniones), debemos recurrir en lo posible a 
instrumentos escalares; si anotamos actitudes, motivos, variables de personalidad, 
recurrir entonces a las técnicas autorizadas, teniendo en cuenta que si no son practicables 
en un survey masivo no hay suficiente razón para remplazarlas por preguntas de 
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cuestionario. 


Una “lista de control” para el cuestionario final como un todo y para las diversas 
baterías de preguntas 


1. Las preguntas deberán agruparse de modo que formen una unidad (batería). 

2. Las preguntas deben estar ordenadas de modo tal que exista una progresión lógica 
en la entrevista, de manera que: a) el informante sea introducido en la entrevista 
despertando su interés; b) pase de las preguntas más simples a las más complejas; c) se 
procure no enfrentar al informante con un pedido prematuro y súbito de datos 
personales; d) aunque no esté directamente relacionado con la formulación de las 
preguntas, debe anotarse que, cuando se efectúa una pregunta que puede provocar 
embarazo en el entrevistado, ha de dejársele oportunidad para que se explique, con el 
objeto de no frustrar la eficacia del resto de la entrevista, y е) se conduzca el 
interrogatorio de un marco de referencia a otro lo más suavemente posible sin efectuar 
saltos bruscos. 

3. Las preguntas introductorias del cuestionario deberán ser atrayentes sin provocar 
controversias. Se aconseja comenzar con cuestiones aparentemente irrelevantes, 
inofensivas о neutras, que despierten simultáneamente los intereses del R y “lo 
introduzcan” en la entrevista. 

4. Las preguntas más cruciales o estratégicas del instrumento no deberán aparecer al 
principio de la entrevista —por las razones ya vistas— ni al final, cuando la fatiga puede 
influir en el ánimo del R. 

5. Las preguntas que se refieren a aspectos íntimos del respondente deberán dejarse 
para el final de la entrevista, cuando ya existe presumiblemente mayor confianza entre 
entrevistador e interrogado. 

6. El cuestionario debe finalizar con expresiones de agradecimiento por la 
colaboración prestada por el entrevistado, lo que facilitará el contacto para eventuales 
entrevistas futuras, de la misma o de otra investigación. 

7. Si posteriormente es necesario para el relevamiento separar rápidamente a los 
sujetos de la muestra en grupos previamente determinados, se recomienda emplear 
papeles de distintos colores (o bandas de colores diversos en los extremos superior 
derecho o izquierdo del documento) para cada grupo. 

$. Se recomienda que las preguntas de una batería vayan desde los tópicos más 
generales a los más específicos. 

9. Para los temas principales de la investigación, planear incluir preguntas que 
ubiquen el mismo contenido en diferentes contextos, con el fin de poder comparar luego 
las respuestas. 

10. Si hemos empleado una batería de ítems para algunos temas, es conveniente 
incluir alguna(s) pregunta(s) que nos sirvan para verificar la adecuación y consistencia 
de las preguntas como un todo. 

11. Si planificamos emplear el cuestionario posteriormente (por ejemplo, para 
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estudios cross-cultural) debemos redactar las preguntas de manera que no se hagan 
temporales; es decir, que se puedan aplicar después sin necesidad de introducir cambios, 
para asegurarnos las posibilidades de comparación. Esto significa evitar el empleo de 
fechas, nombres de personajes efímeros, modas o normas locales, etcétera. 

12, Si nuestro estudio va a compararse con otros realizados por autores distintos, 
debemos emplear, en lo posible, la misma formulación de las preguntas. 


“Lista de control” de asuntos de entrevistas relacionadas con el cuestionario 


Preguntas estructuradas. Regla fundamental: La pregunta debe ser leída en el lenguaje 
exacto con el que figura en el cuestionario. Reglas suplementarias: 

1. Tratándose de una pregunta de hechos (como edad, estatus social, etc.), el 
entrevistador tiene libertad para reformular la pregunta. Lo importante es que la 
información que deseamos obtener se consiga efectivamente. 

2. Si el entrevistado no ha comprendido la pregunta o, sencillamente, la malinterpreta, 
el entrevistador está autorizado para repetirla. Sin embargo, no está autorizado para 
darle otra formulación. 

3. Las preguntas follow-up tienen que ser hechas por el entrevistador. Incluso si el 
respondente ha contestado en buena forma, el entrevistador tiene que asegurarse de que 
el entrevistado no tiene nada más que agregar. El trabajo de las respuestas agregadas a la 
pregunta follow-up debe ser anotado por el entrevistador. 

4. En general, si una pregunta es algo débil o completamente irrelevante y su 
repetición ( núm. 2) no da ningún resultado, el entrevistador puede tratar de hacer una 
pequeña reformulación. En este caso, la respuesta original debe ser anotada, y con el 
fraseo de la nueva formulación (palabra por palabra) obtendremos la nueva respuesta 
dada por el entrevistado, la cual debe separarse de la primera respuesta. 

5. Si existen alternativas fijadas рага la respuesta (pregunta de “cafetería”), 
frecuentemente sólo se anota una de las alternativas. 

6. En el caso de una pregunta abierta, la respuesta exacta del respondente debe ser 
dada palabra por palabra. Por ejemplo: No; “el R. piensa que... pero”, sino: “Pienso que 
no es correcto que...” Cualquier desviación de las reglas dadas debe agregarse a las 
instrucciones de los entrevistadores. 

Para preguntas no estructuradas las reglas deben aplicarse en cada caso por separado. 


UN EJEMPLO 


A continuación presentamos un cuestionario autoadministrado, utilizado para la 
evaluación de un programa de alimentación escolar en cuatro provincias chilenas 
(Santiago, Valparaíso, Aconcagua y O Higgins), en 1967.? 

Se aplicaron 32 500 cuestionarios en una muestra aleatoria estratificada de escuelas, 
en las que se solicitó información de alumnos y familiares. Los cuestionarios fueron 
distribuidos por los maestros, y el total de la información se recogió en un mes. 

El cuestionario que sirve de ejemplo es el de jefes de familia, y el número en la 
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esquina superior izquierda es idéntico al del cuestionario del niño, que fue completado 
por sus maestros, y a los cuestionarios de padres y madres de familia. Para asegurarnos 
de la complementación entre los dos diferentes cuestionarios solicitamos al maestro que 
escribiera el nombre del alumno en cada cuestionario. 

El cuestionario es además precodificado, salvo en una pregunta (la núm. 24), y los 
números en la última columna corresponden a columnas de tarjetas IBM (las primeras 43 
columnas contenían la información correspondiente al cuestionario de niños; y las 
últimas 8 a características de la escuela). 

Los dibujos en la parte correspondiente a las instrucciones resultaron muy útiles en 
términos de motivación de los respondentes (el porcentaje de retornos fue de 96.5 % del 
total de la muestra). 


CUESTIONARIO PARA JEFES DE FAMILIA 


¡LEER ESTO ANTES DE EMPEZAR! 


Aquí tenemos algunas preguntas que queremos que usted responda. 

Jefe de familia es aquella persona que tiene la mayor responsabilidad económica en el 
hogar; si usted no es jefe de familia, se ruega dar este cuestionario a esa persona para que 
lo llene. (Si no está presente en los 7 días que siguen, llénelo usted en su nombre.) 

Las preguntas que usted conteste serán usadas para un estudio científico, por lo tanto 
son confidenciales y anónimas. El presente estudio es realizado por la Facultad 
Latinoamericana de Ciencias Sociales (FLACSO,) organismo de la UNESCO (Naciones 
Unidas). Cuenta con la colaboración del Ministerio de Educación, de la Junta Nacional 
de Auxilio Escolar y Becas y de la Cátedra de Nutrición de la Escuela de Salubridad de 
la Universidad de Chile. 

Para el propósito del estudio es sumamente importante su colaboración y que 
responda a todas las preguntas en forma verdadera y lo más exacta posible. 

Cuando esté listo el cuestionario, devuélvalo lo más pronto que pueda a la escuela. 

51 usted encuentra algunas dificultades en las preguntas, le recomendamos acudir al 
profesor de su niño para que le ayude. 


Ahora: ¿Cómo se responden las preguntas? 
1.—Marque sólo una respuesta en cada pregunta. 
2.—Marque las respuestas en la columna que dice “respuestas”. 
3.—¿En qué forma marco yo las respuestas? 


a) Sia la respuesta corresponde un número, márquelo con un círculo alrededor del número. 


Aquí hay un ejemplo de esto: — La pregunta es ¿Dónde vive usted? 
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Еп el campo ....... coomPosososo 
Еп una ciudad pequeña ........ 
En una gran ciudad ............ 
Cuando viva en el campo, por ejemplo, marque como se indica arriba. 


Go N ~ 


b) Si se encuentra con una línea que .tenga esta forma ——————— coloque en ella 
la respuesta. 
Un ejemplo: ¿Cuántas personas viven еп la casa? .............. — 
Si viven 5 personas en la casa, marque 5 ; si viven 12 personas, marque 12 . 


4_—¿Cuándo yo hago un error? 
En caso de que usted se haya equivocado en una respuesta, borre o haga una cruz grande en la respuesta 
incorrecta y marque luego la respuesta correcta. 


IE O EDO iria rr 1 
SAA 2 
ARAN ири денна 3 Agradeciéndole desde ya su va- 
liosa colaboración, quedamos a 
su entera disposición para cual- 
quier consulta. 
FLACSO 


J. M. Infante 85 — Santiago 
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CUESTIONARIO PARA LA FAMILIA DEL ALUMNO 


Por favor, ponga el nombre del alumno aquí: ................................ 


Para comenzar quisiéramos algunos datos sobre usted. (Si Respues- No marque 
usted no es el jefe de familia, tiene que contestar las pre- tas пайа aquí 
guntas en el nombre de él.) 


PREGUNTAS 


1.—Sexo del jefe de familia. (Redondee con un círculo el nú- 
mero que corresponde.) 


2.—Edad de usted (jefe de familia), marque así: Por ejemplo, si 
usted tiene 30 años, marque 30 en la línea de al lado, si us- 


ted tiene 56 años, marque 56_ 45-46 
3.—Parentesco que tiene usted (jefe de familia) con el niño. 
Es el padre ....... 1 
= Es la madre ....... 2 47 
Otro pariente ..... 3 
No es pariente .... 4 
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4.—¿Cuánto gana usted (jefe de familia) mensualmente? Marque 
así: si gana, por ejemplo, E” 240 mensual (o sea, E° 60 sema- 
nal), redondee el número 2. 


Menos de E* 100 mens. ..... o Menos de Е° 25 sem. ... 1 
De E” 101 а E° 300 mens. о De E° 26 а E° 75 sem. 2 
De E” 301 а E° 500 mens. о De E” 76 a E° 125 sem. 3 
De E” 501 а E° 700 mens. o De E° 126 a E° 175 sem. 4 48 
De E° 701 a E° 1000 mens. о De E* 176 a E° 250 sem. 5 
De Е° 1001 a Е° 1500 mens. о De E* 251 a Е° 375 sem. 6 
De E” 1501 a Е° 2000 mens. o De E* 376 a Е° 500 sem. 7 
De E* 2001 a E* 5000 mens. o De Е° 501 a E* 750 sem. 8 
De E° 3000 o más mens. .... о De E° 751 о más sem. .. 9 


< 


PREGUNTAS 
Respues- No marque 
tas nada aquí 


¿Qué estudios ha realizado usted? (jefe de familia), redondee Mar- 


con un círculo el número o letra que corresponde. que 
aquí 
No E A ENSERES 1 
Fue hasta 20 айо de escuela primaria о menos ........... 2 
Fue hasta el 40 año de escuela primaria ................. 3 
Fue más de 40 año, pero no llegó a completar 60 año .... 4 
Completó la escuela primaria ........................... 5 49 
Estudios secundarios incompletos ........................ 6 
Estudios secundarios COMPl€tOS .......................... 7 
Otros estudios posteriores al secundario, pero no de carácter 
A AA элд сааса лур арыл АШЛЫ 8 
Estudios universitarios incompletos ....................... 9 
Estudios universitarios completos ........................ х 
o A MAA 
RAEE A ADA ҮС Y 


€ aaaaaaaŘŮŘŮĖŐ— 
6.—Total de dinero que entra en la familia. 
Indique aquí cuánto dinero reciben los miembros de la familia 
en total. Sume los sueldos y salarios de todos los que traba- 
jen en la саза. Coloque un círculo en el número que corres- 
ponde. Por ejemplo, si ganan en total E° 400, o sea, E° 100 
semanal, redondee el número 3. 


Menos de E* 100 mens. ..... o Menos de E* 25 sem. .... 
De E” 101 а Е° 300 mens. De E” 26a E° 75 sem. 
De E° 301 a E° 500 mens. De E° 76 а E° 195 sem. 
De E” 501 а Е° 700 mens. De E° 126 а E° 175 sem. 
De E° 701 а E° 1000 mens. De E° 176 a E° 250 sem. 
De E* 1001 a E* 1500 mens. De Е° 251 a E° 375 sem. 
De E” 1501 a E° 2000 mens. De E* 376 а E” 500 sem. 


сооооо 
чо оњ оо м н 
Qu 
о 
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De E* 2001 а Е° 3000 mens. o De Е° 501 a Е° 750 sem. 
De E* 3001 a Е° 5000 mens. о De E* 751 a E* 1 250 sem. 
Más de Е° 5000 mens. ...... o Más de E* 1251 sem. .... 


7.—¿Cuál es su ocupación? (la del jefe de familia). 
Por favor, redondee con un círculo el número que corres- 
ponde al grupo de su ocupación. Antes de hacerlo, lea deta- 
lladamente todos los grupos y, cuando no encuentre escrita 
la suya, marque el grupo de ocupaciones que más se le pa- 


recen. 


Estoy en 
el grupo 
de: 


Estoy en 


el grupo 
de: 


Estoy en 


el gru 
de: 


Estoy en 


el grupo 
de: 


Estoy en 


el grupo 
de: 


Trabajadores no especializados, asalariados y 
por cuenta propia.—Por ejemplo: ayudantes, 
aprendices, industriales de construcción y mi- 
nería, garzones, estibadores, porteros, propieta- 
rios de pequeña parcela rural que trabajan la 
tierra por su cuenta y sin empleados, vendedor 
ambulante, mozo de servicio y limpieza, diarie- 
ro, lustrabotas, empleada doméstica, basurero, 
peón agrícola, pololero y similares .......... 


Trabajadores especializados, asalariados y por 
cuenta propia.—Por ejemplo: técnicos no titu- 
lados, linotipistas, gasfitero, carpintero, estuca- 
dor, pintor, mecánico, operador de máquinas, 
peluquero, chofer, bencinero, pescador, minero, 
soldado, cabos, marineros y similares ........ 


Personal de supervisión.—Por ejemplo: capata- 
ces de industria, minería y construcción, sub- 
oficiales de las fuerzas armadas, superiores a 
cabos (sargento, suboficial, suboficial mayor), 
jefe de cocina y similares .................. 


Empleados de administración pública, privada 
y comercio de grado П y comerciantes minoris- 
tas, —Por ejemplo: oficinistas de administración 
pública y privada, empleados de comercio, ven- 
dedor de mostrador, viajante, corredor de segu- 
ros, dactilógrafos, telefonistas, comerciantes mi- 
noristas con un empleado o ninguno, y simi- 
т. conoscan ro өө асе: өөө ә 


Empleados de administración pública, privada 
y comercio de grado 1 y pequeños propietarios 
de comercio.—Por ejemplo: técnicos titulados, 
secretarias, enfermeras, fotógrafos, dibujantes, 
laboristas, profesores primarios, propietarios de 
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8 
9 
х 


51 


Estoy en 


el grupo 
de: 


Estoy en 


el grupo 
de: 


Estoy en 


el grupo 
de: 


pequeña empresa, o comercio minorista con 2 
hasta con 5 empleados y similares ........... 


Jefes menores de administración pública y pri- 
vada.—Por ejemplo: jefes de grupo o de ofici- 
na, profesores secundarios, oficiales de las fuer- 
zas armadas, desde subteniente hasta capitán 
inclusive, director de escuela primaria y simi- 
lares ....... AA is ТТЕ 


Empresarios medianos y jefes intermedios de 
administración pública y privada.—Por ejem- 
plo: dueños de empresa o comercio, con 6 hasta 
con 30 dependientes, secretarios de facultades, 
o rectores de colegio secundario, jefes de sec- 
ción o departamento, jefes de fuerzas armadas, 
de mayor a coronel, profesionales universitarios 
que ejerzan su profesión y similares ........ 


Grandes empresarios y altos ejecutivos.—Por 
ejemplo: dueños de grandes empresas indus- 
triales, agrícolas y comerciales con más de 30 
empleados, directores de escuelas universitarias, 
decanos, rector, director general, subsecretarios, 
ministros, gerentes directores, presidentes y vi- 
cepresidentes de grandes empresas, generales, 
almirantes y similares ....o.omoooo.oooocmsoca 


Escriba ahora, con algún detalle, en qué con- 


siste su ocupación (del jefe de familia), qué es 
lo que Басе .......::: о EAS 
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V. LA CODIFICACIÓN * 
HÉCTOR APEZECHEA 


ANTES DE considerar el tema propio de este trabajo, conviene hacer unas breves 
puntualizaciones para situarlo dentro de los límites que nos hemos propuesto, y señalar 
algunos de los alcances de la problemática de la codificación que no tienen cabida lógica 
en el cuerpo del trabajo. 

En primer lugar, se trata de estudiar el problema de la codificación en las 
investigaciones sociológicas. Su utilización en otras ciencias sociales — demografía, 
psicología, ecología, geografía humana, etc.—, que el autor desconoce, podría asumir 
otras variaciones y alternativas de empleo. Por lo tanto no se mencionarán en las líneas 
que siguen. 

En segundo lugar —y salvo las menciones que se hacen en el apéndice—, 
procuraremos hablar de la codificación en aquellas investigaciones que utilizan como 
instrumento de relevamiento el cuestionario estructurado, y que tienen como objetivo 
elaborar los datos mecánicamente con tarjetas perforadas tipo IBM, lo cual, por cierto, 
restringe en buena medida el campo que abarca este trabajo. 

En tercer término, cabe señalar que, en el marco del diseño total de una investigación, 
los problemas que suscita la codificación de algún modo “invaden” la casi totalidad del 
diseño. Así, es razonable pensar que, aunque la etapa propiamente de codificación se 
ubica simultáneamente o posteriormente al relevamiento —bien sea al proponer el 
elenco de “variantes” (variables operacionalizadas) y de indicadores de las mismas, al 
confeccionar el instrumento de relevamiento o al proyectar el plan de explotación de los 
datos—, se tengan en cuenta las ventajas y obstáculos que el procedimiento de 
codificación trae aparejados. Es una cuestión dudosa, a mi entender, que la codificación 
en cuanto tal imponga limitaciones tanto a la proposición de la o de las hipótesis a probar 
empíricamente como a las variables o sus respectivas dimensionalizaciones. En tal 
sentido, sería solamente al nivel de las variantes cuando comenzaría a tener validez el 
hecho de que la codificación debe ser tenida en cuenta. No parece necesario ejemplificar 
los asertos contenidos en este parágrafo. En el curso de la exposición que sigue el lector, 
por sí mismo, podrá percibir en qué consisten las limitaciones y ventajas del 
procedimiento de codificación y de ella en sí misma, así como cuáles deberán ser los 
elementos que el investigador deberá tomar para que este procedimiento agilice y no 
entorpezca el desarrollo de la contrastación empírica de sus hipótesis. 


La codificación 
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La codificación es, genéricamente, la primera operación a realizar en el marco de la 
elaboración de datos, inmediatamente después de efectuado el relevamiento. (Si bien 
más adelante veremos que puede comenzar simultáneamente con el relevamiento, como 
es el caso, por ejemplo, del cuestionario de preguntas cerradas.) Conviene comenzar por 
las definiciones que algunos autores han dado, para tener una idea de qué se entiende por 
codificación en sociología y extraer las características más relevantes asignadas a esta 
operación. 

Según Maurice Duverger,' tal operación consiste en asignar un número a cada 
categoría de respuestas, el cual determinará el lugar de la correspondiente perforación 
sobre la ficha que sirve de base a los escrutinios mecanográficos. 


Hyman explicita más el sentido de la operación,? al aclararnos que es un proceso de 
clasificación dentro de un limitado número de categorías de las respuestas de cada 
persona. Su propósito es resumir los datos originales de manera tal que puedan ser 
transferidos a las tarjetas perforadas y tabulados mecánicamente. 


Por último, nos parece importante hacer referencia a Selttiz? y otros autores —más 
adelante veremos por qué—, cuando nos dice que es el procedimiento técnico por el cual 
los datos originales son transformados en símbolos (generalmente números) de modo 
que puedan ser tabulados y contados. La transformación no es, sin embargo, automática: 
envuelve juicio de parte del codificador. 


Podemos tener una noción aproximada de la codificación a través de las citas,“ que en 
parte se repiten y en parte se complementan, pero nos parece importante destacar un 
aspecto de la definición de Selttiz: la codificación implica la transformación de los datos 


relevados en símbolos, en general numéricos. Esta noción parece darnos la clave 
fundamental acerca de la naturaleza de la codificación: si bien es cierto que ésta y la 
categorización de los datos son dos operaciones que en la práctica se realizan 
simultáneamente —pudiendo confundirse en una sola—, conceptualmente son dos 
aspectos que deben manejarse por separado. 

La codificación, considerada como operación aislada, consiste en la atribución de un 
determinado símbolo a una determinada respuesta. Pero considerada desde un punto de 
vista lógico, parecería ser el resultado de la categorización, puesto que el hecho de que la 
respuesta se ubique en una determinada categoría implica que se le atribuirá un 
determinado símbolo. 

Probablemente el proceso cronológico real no haga admisible esta distinción en la 
mente del codificador, tanto para las preguntas llamadas erróneamente precodificadas 
(aquellas cuyas categorías de respuestas ya tienen un número de código asignado, 
impreso en la ficha de encuesta) como, sobre todo, para aquellas en las que el código es 
un documento independiente de las fichas de encuesta. Al buscar en el código a qué 
categoría corresponde la respuesta en cuestión, se encontrará, simultáneamente, el 
símbolo correspondiente (número); asimismo, al asignar el número de código (símbolo) 
se estará codificando y categorizando a la vez. 

Tomemos como ejemplo de lo que estamos diciendo una investigación en la cual uno 
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de los datos a relevar sea el estado civil de los entrevistados. En la ficha de encuesta la 
pregunta podría estar diseñada de la siguiente manera: 


Estado civil 


Soltero Г] 
Casado = 
Divorciado O 
Viudo g 
Unión libre ГЛ 
Sin dato O 


Supongamos que una de las respuestas recibidas es “casado”. A los efectos de relevar 
el dato, puede marcarse en el cuadro correspondiente con una X, una raya inclinada, un 
círculo, o cualquier otro símbolo. Hasta el momento, lo único que hemos hecho es 
recoger el dato, pero aún no se ha planteado la etapa de codificarlo. Para hacerlo, en este 
caso, debemos recurrir a un elemento auxiliar, el código (al que nos referiremos más 
adelante), en el que encontraremos el número que corresponde a la respuesta “casado”. 
Ubicado el número, para completar la codificación podemos usar dos vías: escribir el 
número correspondiente junto a la respuesta en la propia ficha de encuesta, o recoger el 
número correspondiente a la respuesta en una hoja aparte (hoja de codificación). 

Observamos que, además de codificar la respuesta “casado” con el número 
correspondiente, estamos colocando la respuesta, a los efectos de su elaboración 
(tabulación, etc.), dentro de una categoría. Dicha categoría comprende todas aquellas 
respuestas a las que corresponde asignar el mismo número. Vemos, entonces, el sentido 
que tenía nuestra afirmación: aunque se realicen simultáneamente, codificación y 
categorización implican dos etapas de la elaboración de los datos que deben analizarse 
por separado. 

Si nos atenemos al ejemplo mencionado, es posible decir que la categorización de los 
datos, no ya a los efectos de su elaboración mecánica, sino simplemente de su ubicación 
en una etapa determinada, se realiza antes que la codificación. El solo hecho de marcar el 
cuadrado correspondiente al relevar el dato ubica la respuesta del sujeto dentro de las 
categorías generales de “soltero”, “casado”, etc., con independencia del número de 
código que le corresponda. Por cierto que esta posibilidad se da con referencia a cierto 
tipo de preguntas denominadas “cerradas”, pues admiten un número limitado de 
posibilidades de respuestas (en nuestro ejemplo 6 posibilidades). 

Avancemos un poco más en nuestro ejemplo del estado civil, e imaginemos la misma 
pregunta diseñada de una manera distinta: 
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Estado civil 


Soltero pra 
Casado Ф - 
Divorciado O 3 
Viudo O 4 
Unión libre O5 
Sin dato O 6 


La diferencia con respecto al diseño anterior consiste en que se ha colocado un 
número al lado de cada casillero correspondiente a cada respuesta; el número indica el 
símbolo en que la codificación corresponde a cada respuesta. De modo que, al relevar el 
dato, se está al mismo tiempo categorizándolo y codificándolo. Para este tipo de 
preguntas que hemos llamado “cerradas”, el recurso de colocar en la propia ficha de 
encuesta el número de código tiene una finalidad eminentemente práctica: ahorra 
esfuerzo, evitando la duplicación innecesaria de tareas. Cuando directamente el 
encuestador, por el solo hecho de relevar el dato, codifica, libera a los codificadores de 
buscar cuál es el número que corresponde a cada respuesta de este tipo, con lo cual 
pueden dedicarse a la codificación de aquellas respuestas que no admiten este tipo de 
codificación simultánea al relevamiento. 

Corresponde una última puntualización relativa a la necesidad de la codificación para 
poder elaborar los datos. A pesar de que prácticamente es empleada en todas las 
investigaciones sociológicas, no es una técnica necesaria para la elaboración de los datos 
desde un punto de vista estrictamente lógico. Es decir que su empleo no se impone por la 
naturaleza de los datos o por razones de orden metodológico. Puede concebirse una 
investigación en la que los resultados sean elaborados manualmente, es decir, que se 
revise ficha de encuesta por ficha de encuesta y se vaya categorizando en una hoja aparte 
las respuestas obtenidas. En el ejemplo del estado civil, tomaríamos una hoja en la que 
anotaríamos las 6 posibilidades de respuesta y posteriormente iríamos revisando cada 
ficha y anotando (con una tilde, etc.), la respuesta en esa hoja. Si tuviéramos que anotar 
las respuestas contenidas en 100 fichas, al final de nuestro trabajo tendríamos, en la hoja 
de elaboración: 
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Estado civil 


Soltero HH HH НН ННН Hil 
Casado Hit iht HH IHE HH НІНІ 
Divorciado РРА lill 
Viudo А III 
Unión libre ## НН 
Sin dato //// 


De esta manera habríamos obviado el pasaje por la codificación, yendo directamente 
a contar la cantidad de casos que caen en cada una de las categorías de respuestas. 

Lo que sí es insoslayable en toda investigación es la categorización de los datos, 
puesto que, según sea la frecuencia de respuestas que entren en cada categoría, la 
interpretación de los resultados de la investigación será distinta. Por sobre todas las 
cosas, las categorías en que se dividen las preguntas sirven para ubicar las respuestas en 
clases distintas y hacer posible, de esa manera, su ulterior interpretación. 

Como se ha dicho, la codificación no es necesaria en un plano lógico, pero su empleo 
es corriente en las investigaciones sociológicas, fundamentalmente por dos razones. En 
primer término, porque el volumen de los datos relevados hacen necesaria su utilización. 
La elaboración de los datos, incluso en el caso de la elaboración manual, sin el auxilio de 
la codificación, es muy lenta y costosa, por encima de un número muy reducido de 
fichas de encuesta. La segunda razón radica en lo siguiente: cuando el volumen de los 
datos es muy grande, se impone su elaboración por medios mecánicos (con el sistema de 
tarjetas perforadas) y para poder utilizarlos la técnica de la codificación es 
imprescindible. Por otra parte, los símbolos numéricos en codificación se emplean 
teniendo en cuenta las limitaciones que imponen los métodos mecánicos de elaboración. 


Distintas clases de preguntas 


Conviene mencionar este punto antes de proseguir, puesto que la codificación se efectúa 
sobre la base de un código y éste es construido de manera distinta según el tipo de 
preguntas que integren el cuestionario. Pueden distinguirse, grosso modo, dos clases de 
preguntas fundamentales: preguntas abiertas y preguntas cerradas, las cuales, a su vez, 
pueden ser preguntas de hecho (o sobre hechos) y preguntas de opinión (o sobre 
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opiniones). 

Preguntas abiertas se llama a aquellas en que el entrevistado puede contestar 
libremente; por tanto, el número de respuestas que puede darse resulta teóricamente 
ilimitado. Como ejemplo consignamos la siguiente pregunta: “¿Qué opina usted acerca 
de los partidos políticos?” 

Por el contrario, las preguntas cerradas obligan al entrevistado a optar por una serie de 
posibles respuestas previamente consignadas en las mismas fichas de encuesta. Es el 
caso de nuestro ejemplo sobre el estado civil. La persona entrevistada debe, 
necesariamente, señalar una de las cinco posibilidades establecidas en la ficha de 
encuesta. 

En cuanto a la categoría de preguntas relativas a hechos, tienen como finalidad 
indagar sobre situaciones referentes a las personas: estado civil, ocupación, edad, 
instrucción, ingresos, etc. El interés del encuestador está en que el entrevistado responda 
lo más verídicamente posible acerca de cualquiera de los rubros que en el cuestionario se 
mencionen, sin que interese lo que la persona opine al respecto. 

Pregunta típica de opinión es la que mencionamos al ejemplificar el tipo de preguntas 
abiertas: “¿Qué opina usted acerca de los partidos políticos?” Como se comprende, no 
interesa saber lo que realmente son los partidos políticos, sino la opinión de los 
encuestados sobre los mismos. Las preguntas de opinión tienen como finalidad indagar 
acerca de las opiniones del grupo humano a entrevistar, sobre el o los tópicos que 
abarque la encuesta. 

Tomando como base estas distinciones, podemos decir que, en general, las preguntas 
abiertas son de opinión y las preguntas cerradas son sobre hechos. Y decimos en general 
porque hay ciertas preguntas de hecho, como en el caso de las relativas a ocupación, que 
es prácticamente imposible diseñarlas como preguntas cerradas (51 bien, técnicamente, 
deba admitirse). 

De la misma manera, aunque las preguntas de opinión se diseñan generalmente 
abiertas (lo que se busca, justamente, es el máximo de espontaneidad en las respuestas), 
puede admitirse, y de hecho sucede, que una pregunta de opinión sea cerrada; por 
ejemplo, si se desea indagar sobre un tema cualquiera la existencia de estereotipos en la 
opinión pública. 

Los problemas que se plantean en la confección de los códigos y en la técnica de la 
codificación están determinados, en parte, por el tipo de pregunta de que se trate. Con 
base en lo dicho anteriormente, estamos ahora en condiciones de hacer un breve 
comentario sobre la noción de código y su confección. 


El código 


En términos muy generales, puede decirse que código es el conjunto de símbolos 
correspondientes a cada una de las categorías en que se dividen las respuestas obtenidas 
en un cuestionario (ficha de encuesta, propiamente). 

Se desprende que lo que interesa particularmente a la codificación son los símbolos 
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—en nuestro caso numéricos— atribuidos a cada categoría, más que las categorías 
propiamente dichas; éstas importarán, de modo fundamental, en las etapas posteriores de 
la elaboración de los datos. Sin embargo, debe tenerse presente que el código se 
confecciona sobre la base de la división de las respuestas obtenidas en categorías o 
clases. Por ello, para el establecimiento de las categorías se nos presentan todos los 
problemas —lógicos y prácticos— de la realización de una clasificación. 

No nos detendremos a considerar los aspectos lógicos del problema; veremos sólo 
algunas de las indicaciones que señala la bibliografía sobre cuestiones más bien prácticas 
de la clasificación. Pero queremos destacar que los investigadores deben conocer en 
profundidad los problemas —tanto lógicos como prácticos— referentes a la 
clasificación, porque los errores cometidos en esta etapa de la investigación pueden 
comprometer la correcta verificación de la o las hipótesis. 


Nomenclatura 


Para Сһеугу, con el título de “Establecimiento de una nomenclatura”, ésta es “la lista de 
modalidades del carácter en cuestión que se pretende distinguir”. Es una clasificación de 
un ítem de cierta importancia, como, por ejemplo, las regiones geográficas, ocupación, 
industrias, causas de deceso, etc. El hecho de que una misma clasificación de un mismo 
ítem sea empleada en varias investigaciones permite una mejor comparación de los 
resultados, sobre todo para el tipo de encuesta al que se refiere Chevry, la encuesta 
estadística. 

También podemos decir que nos hallamos frente a una nomenclatura cuando las 
respuestas a una pregunta deben dividirse en un número muy grande de rubros; sólo son 
consideraciones de cantidad de rubros e importancia del item —ambos aspectos ligados 
— las que, frente a casos concretos, nos permiten afirmar de un modo empírico la 
existencia de una nomenclatura. 

Cuando nos hallamos ante una clasificación de oficios y profesiones que incluye 
centenares de rubros, diremos que estamos frente a una nomenclatura; no podríamos 
decir lo mismo ante una clasificación de sexo o estado civil; dos rubros en el primer 
caso, cinco o seis en el segundo. 

Las reglas que Chevry señala como necesarias para el establecimiento de una buena 
nomenclatura pueden resumirse en: ser completa; ser lo suficientemente clara y precisa; 
no tener un carácter demasiado teórico, y adaptarse a las necesidades más generales en lo 
posible: “Decir que una nomenclatura debe ser completa no significa que debe ser 
complicada y detallada, sino al contrario. Conviene que sea lo suficientemente detallada 
como para proveer las clases de que se tenga necesidad; pero sería molesto que lo fuera 
en exceso”. 

La necesidad de claridad y precisión surge de que “toda unidad estadística debe poder 
ser clasificada sin dudar en un rubro de la nomenclatura y sólo en uno”. “Para establecer 
una nomenclatura correcta que no presente ninguna ambigúedad, es necesario, 
previamente, elegir un criterio único de disociación de las modalidades que se requiere 
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distinguir.” 

Puesto que la nomenclatura está destinada a clasificar las declaraciones relativas a los 
hechos, cuando se establece “no conviene conferirle un carácter demasiado teórico; no 
hacer una construcción del espíritu, satisfactoria desde un punto de vista lógico, pero que 
peligra no corresponder suficientemente con la realidad”. 

Esta tercera regla merece, a nuestro juicio, dos observaciones que eviten confusiones. 
Primero, podemos aceptarla en la medida en que el autor está hablando de las encuestas 
estadísticas (o macrosociales) en las que importa el nivel descriptivo más que el 
explicativo. En segundo lugar, ese argumento es inaceptable para una investigación 
explicativa. Si no podemos efectuar una clasificación correcta desde el punto de vista 
lógico, es como consecuencia de nuestra ignorancia acerca de los hechos, no porque de 
la aplicación estricta de las reglas lógicas resulte un apartamiento de la realidad. 

El propio Chevry se encarga de corroborar —en cierto sentido— nuestras 
observaciones: “Una nomenclatura estadística no tiene necesidad de constituir un 
instrumento de gran precisión, si debe servir para clasificar declaraciones, la mayor parte 
de las cuales serán relativamente vagas, lo que, desdichadamente, es el caso más 
general”. 

Por su parte, Selltiz considera que deben seguirse tres reglas fundamentales para el 
establecimiento de las categorías: deben derivar de un principio simple de clasificación, 
es decir, deben ser exhaustivas, tiene que ser posible colocar cada respuesta en alguna de 
las categorías en que se halla dividida la pregunta, y las diversas categorías 
correspondientes a la misma pregunta deben ser mutuamente excluyentes, de manera que 
no sea posible colocar una respuesta dada en más de una categoría: “La calidad de la 
categorización de los datos depende enteramente de la validez de las categorías 
empleadas. Las categorías deben ser bien definidas desde un punto de vista conceptual y 
deben ser relevantes a los fines de la investigación”. 

Antes de entrar en el tema de la confección del código parece pertinente dar una 
formulación un poco más precisa de cinco de los conceptos que se han manejado hasta 
ahora: clasificación, código, categorías, categorización y codificación. 

Clasificación. Es la operación que permite ordenar —según ciertas reglas, de las 
cuales ya vimos algunas— las respuestas que se presume darán o dieron los 
entrevistados (dependiendo de que la clasificación se realice antes o después del 
relevamiento) al cuestionario que les fue sometido. Esas respuestas, por lo tanto, se 
ubican en clases distintas. 

Código. Es el conjunto de símbolos que se atribuye a cada una de las diferentes clases 
en que se dividen las respuestas a una pregunta. 

Categorías. Son, precisamente, las clases en que vimos que se dividen las respuestas 
a una pregunta. Conceptualmente, parece que no puede establecerse ninguna distinción 
entre clase y categoría. Los autores consultados emplean indistintamente ambos 
conceptos, aunque el término categoría es, en general, más empleado. Podría 
establecerse una sutil diferencia entre clase y categoría si sostenemos que las clases 
pasan a ser categorías cuando se les asigna un número de código, o cuando esas clases 
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son recogidas еп un documento especial con vistas a la elaboración de los datos; pero 
sería peligroso sostener esta distinción como evidente. 

Categorización. Consiste en ubicar una respuesta concreta en una de las clases o 
categorías. 

Codificación. Supone la atribución del símbolo —extraído del código— que 
corresponde a la respuesta en cuestión. 

En el marco de estas cuatro operaciones —clasificación, construcción del código, 
categorización y codificación— están inscritos los problemas referentes a la 
codificación. 


Confección del código 


Para Duverger, la confección del código “no ofrece ninguna dificultad en las preguntas 
cerradas, en las que, por definición, las respuestas son limitadas y fáciles de distinguir... 
También es muy fácil en las preguntas de hecho: sexo, edad, residencia, partido, religión. 
Por el contrario, es muy difícil en las preguntas abiertas de respuesta totalmente libre”. 

Conviene acotar que cuando Duverger hace referencia al código le da, justamente, el 
sentido con que nosotros lo definimos: el conjunto de símbolos correspondientes a cada 
una de las categorías y no las categorías propiamente dichas. Es en este sentido como 
puede aceptarse su afirmación de que la elaboración del código no ofrece dificultades en 
las preguntas cerradas, sin caer en el error de confundir esto con categorización. Aun 
tratándose de preguntas cerradas, el previo establecimiento de las categorías presenta 
dificultades que hay que resolver bien para no malograr los resultados de una 
investigación. 

A los efectos del diseño y confección del código, interesa primordialmente la división 
en preguntas abiertas y cerradas, más que la división entre preguntas de hecho y de 
opinión; razón por la cual al hablar de preguntas cerradas englobaremos en esta 
denominación tanto las de hecho como las de opinión. Más adelante veremos que esta 
otra distinción nos interesa cuando hablemos de preguntas abiertas. 

Como ya mencionamos, las preguntas cerradas son aquellas en las que todas las 
posibilidades de respuesta del entrevistado están taxativamente enumeradas de 
antemano. 

Tomemos, por ejemplo, la siguiente pregunta: “¿Está usted de acuerdo con la actual 
política del gobierno?” Las posibilidades de respuesta son infinitas, pero por razones que 
tienen relación con el objetivo de la investigación nos interesa solamente saber a grandes 
rasgos la opinión de los entrevistados y, en este sentido, “cerramos” la pregunta en las 
siguientes posibilidades: 
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¿Está usted de acuerdo con la actual política del gobierno? 


Completamente de acuerdo O 
Medianamente de acuerdo Г] 
Totalmente en desacuerdo O 
No desea contestar E 
Sin dato п 


En este caso, de igual modo que en el ejemplo dado sobre el estado civil, podemos 
colocar un número en el costado exterior derecho de cada casillero, de tal forma que la 
pregunta quedaría confeccionada de la siguiente manera: 


¿Está usted de acuerdo con la actual política del gobierno? 


Completamente de acuerdo Era 
Medianamente de acuerdo 
Totalmente en desacuerdo 
No desea contestar 

Sin dato 


odoo 
сч нъ сого 


De la misma manera es posible proceder con todas las preguntas cerradas que deban 
ubicarse en una ficha de encuesta; es decir que los números correspondientes a cada 
categoría de respuestas a cada pregunta están impresos en la propia ficha. 

De modo que podemos decir que el código de esta clase de preguntas está inserto en 
la propia ficha de encuesta, en vez de formar un instrumento separado, como veremos 
que sucede con las otras clases de preguntas. Si todas las preguntas de una encuesta 
fueran cerradas, la ficha y el código constituirían un solo y único documento. 

Pasemos ahora a considerar los problemas que se plantean en la confección del 
código cuando se trata de preguntas abiertas, considerando en primer lugar las referidas a 
cuestiones de hecho y tomando como ejemplo típico el de la ocupación. 

Si bien teóricamente es posible, en los hechos resulta imposible colocar en una ficha 
de encuesta todas las posibles ocupaciones de los sujetos a entrevistar; sobre todo si se 
tiene en cuenta que la ocupación es una variable de gran importancia y que se impone 
relevarla con cierta minuciosidad. Por otro lado, cerrar la pregunta sobre ocupación 
complicaría enormemente el diseño de la ficha de encuesta, no compensando los riesgos 
que se correrían en este caso frente al tiempo que lleva la codificación posterior de las 
respuestas. 

La solución que se adopta, en consecuencia, es colocar en la ficha cada uno de los 
ítems de la variable, con un determinado espacio en blanco para que los encuestadores 
escriban el dato que corresponda. El diseño puede ser como sigue: 
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Ocupación 


Trabajo зл.» cr A бан 
Dependencia .....o.ooooocorsorsircnrarcscocoonoanrarasanass 
SOCIA AAA AAA INEA RARA AAA 


Una vez relevados los datos requeridos, en el casillero (o casilleros, según el código 
implique la colocación de uno, dos o más números), el codificador coloca el o los 
números correspondientes, según el código, junto a cada casillero. 

Esta operación implica que, con anterioridad al relevamiento o, por lo menos, con 
anterioridad a la codificación, se ha confeccionado un código de las ocupaciones. Este 
código consiste en un instrumento separado y distinto de la ficha de encuesta, en el que 
las ocupaciones o los ítems, en su caso, son divididos en diversas categorías, a las que se 
les asigna uno o varios números, según corresponda. 

No se nos escapa, y nos parece importante señalarlo con cierta extensión por la 
frecuencia con que se investiga en el tema, que existe una gran dificultad para 
categorizar las ocupaciones. Esta cuestión no ha sido hasta ahora resuelta de manera 
uniforme; en cada país, es más, en cada investigación, es frecuente encontrar 
categorizaciones diferentes sobre similares ocupaciones. 

Hay dos tipos de problemas fundamentales que se plantean en el caso de la 
categorización de ocupaciones. 

Por un lado, la construcción del código es muy difícil por cuanto la elaboración de los 
datos por el sistema de tarjetas perforadas impone limitaciones a la utilización de los 
símbolos numéricos; es necesario hacer la combinación de números de código en vista a 
una elaboración eficaz, que evite demoras y confusiones. Por otro lado, la codificación 
en sí presenta dificultades; no siempre es fácil ubicar con precisión una ocupación en 
determinada categoría, sobre todo cuando se trata de casos límite, los cuales son más 
frecuentes de lo que podría suponerse. 

Otra cuestión en relación con la codificación de las ocupaciones, que además tiene 
validez general, es la forma en que ella se realice. Si se trata de preguntas de hecho, la 
codificación de respuestas a preguntas abiertas puede hacerse directamente en la ficha de 
encuesta, si es que se han previsto los casilleros a ese efecto. Pero también la 
codificación puede realizarse (y es lo corriente en el caso de las respuestas a preguntas 
abiertas de opinión) en una hoja separada, comúnmente denominada hoja de 
codificación. 

En relación con la confección del código para las preguntas abiertas de opinión, 
Duverger* resume con mucha claridad el procedimiento a seguir: “La elaboración del 
código se realiza en varias etapas. En primer lugar, se establece un *precódigo”, fundado 
en un análisis hipotético de los tipos de respuestas posibles. El precódigo se aplica 
después a una muestra de entrevistas, lo que permite rectificar experimentalmente sus 
categorías y establecer el código propiamente dicho, que, por lo general, es sometido 
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nuevamente a una verificación experimental llamada ‘codificación de prueba”, en la que 
varios investigadores codifican separadamente una selección de entrevistas, 


comprobándose así la fidelidad del código”. 


Hyman,” en la sección relativa a las instrucciones para codificar las respuestas a 


preguntas abiertas, señala que la forma de desarrollar el código es a través de “la lectura 
de una muestra de respuestas”, lo que, si bien mucho menos explícito, coincide con lo 
dicho por Duverger. 
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Núm. Pregunta-Variable 


IS 


Edad 


Sexo 


Estado Civil 


Grado de Urbanización 


Ingreso Familiar 1968 
al mes (jefe de familia) 


En qué sector industrial 
trabaja el jefe de hogar 


4-5 


— MM = 


— 


a 


o 


осо ASS о м н 


О со “л ©) Ол +» оо м н 


Columna Código Alternativas 


Número de la entrevista 


Las dos últimas cifras del código corres- 
ponden a la fecha de nacimiento. Alguien 
nacido el año 1936 tiene entonces el nú- 
mero de código 36; una persona nacida 
en el año 1897 tiene código 97, etc. 


Masculino 
Femenino 


Casado 
Soltero 
Ha estado casado (divorciado, viudo) 


Capital 
Ciudades sobre 250 000 
Ciudades urbanas con menos de 250 000 
pero más de 110 000 
Ciudades con menos de 110000 pero más 
de 10 000 
Comunidades con menos de 10 000 no ru- 
ral 

Rural 


Sin ingreso 

Menos de Е° 200 

Más de E° 200 y menos de E° 400 
Más de E° 400 y menos de E” 800 
Más de Е° 800 y menos de E° 1 200 
Más de E” 1200 y menos de E° 2 000 
Más de E° 2 000 y menos de E” 2 800 
Más de E° 2800 y menos de E° 4 400 
Más de E° 4400 


Agricultura, silvicultura 

Construcción de casas 

Industria y artesanía 

Transporte 

Comercio 

Empleado público administrativo 
Profesiones liberales 

Otras ocupaciones 

Sin profesión, por еј., dueña de casa, ju- 
bilado, estudiante, etc. 


AAA 
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En cuanto a la distinción que puede hacerse, desde el punto de vista de la confección 
del código, entre las preguntas abiertas de hecho y las preguntas abiertas de opinión, 
puede decirse que radica, en general, en que las preguntas sobre hechos admiten que el 
código se confeccione antes del relevamiento; mientras que, en el caso de las relativas a 
opinión, el código es redactado con posterioridad al relevamiento, sobre la base del 
examen de una muestra de las entrevistas recogidas. Esta última técnica se impone por la 
propia índole de la pregunta; no es posible prever qué es lo que contestarán los 
entrevistados, o mejor, no es posible preverlo en un grado tal que permita confeccionar 
de antemano las categorías. 

Como consecuencia para la etapa de codificación, las categorías así establecidas 
tienen una imprecisión mayor que en el caso de preguntas sobre hechos, y se da más 
fácilmente la posibilidad de que existan respuestas que no encuentren cabida en ninguna 
de las categorías establecidas. Una dificultad de esta naturaleza impone el esfuerzo de 
rehacer el conjunto de categorías en que ha sido dividido un ítem, en vista de que dicha 
división ha resultado inadecuada para ordenar el total de respuestas. 


Ejemplos de códigos 


A continuación anotamos algunos ejemplos de diferentes tipos de códigos obtenidos en 
diferentes investigaciones sociológicas. 

Normalmente, en el código se anota el número de la pregunta; en algunas ocasiones, 
el nombre de la variable, la columna en el espacial IBM, el código, es decir, la posición, 
dentro de las columnas y alternativas utilizadas. (Cuadro en la página anterior.) 

Para facilitar el procesamiento de datos, conviene trabajar con un código general para 
las siguientes categorías: 


O= Según las instrucciones, esta pregunta no se aplica. 

X= El entrevistador no ha puesto la pregunta porque ha encontrado impropio 
hacerlo, por alguna razón. (Indique por qué.) 

Y= La pregunta fue hecha al entrevistado el cual no quiso responder о no sabía la 
respuesta o ha respondido de manera incomprensible. 


Si el entrevistador, por alguna razón, quiere dividir los entrevistados que han obtenido 
una Y en algunas preguntas, en un grupo que ha rechazado responder, corresponde a NA 
= no answer у los que quieren contestar, pero no saben, рк = Don't know. Se puede 
marcar Y en el cuestionario con una explicación del tipo de Y. 

Este código aparece, entonces, para cada pregunta pero no está escrito en el código 
solamente. Por eso dejamos como alternativas en la columna las posiciones 1, 2..., 8, 9, 
libres para las alternativas. Si el investigador está utilizando algunos tipos de 
computadoras, tendrá que cambiar el código porque la máquina no opera con las 
posiciones X y Y. 

El código puede ocupar también dos columnas, si el número de alternativas de una 
pregunta son muchas: 
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Núm. Pregunta-Variable 


6 Еп su opinión, ¿qué es lo 
que probablemente sucede- 
rá en la situación mundial 
del próximo año o en los 
próximos dos años? 


Columna 


11-12 
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Código 


Alternativas 


Razones para el peligro (1) 
Individualismo, líderes, personas 
Líderes soviéticos (como indivi- 
duos) 

Líderes norteamericanos (como 
individuos) 

Otras personas especialmente 
mencionadas 

Desarrollo político internacional 
entre países (2) 

La estructura rusa (poder políti- 
со, etc.) 

La estructura política norteame- 
ricana (poder político, etc.) 
Otras condiciones especiales de 
nacionalismo político (la división 
de Alemania, etc.) 

Diferencias económicas y sociales 
(general) 

Competencia de utilidades, la 
dominación económica de los 
grandes poderes, competencia de 
mercados, etc. 

La gente menos favorecida lu- 
chando por obtener un estándar 
más alto 

Tendencia a los cambios en la 
estructura de clases 

Otras diferencias especiales, eco- 
nómicas y sociales 

Sistemas políticos o ideologías 
(general) 

Comunismo 

Capitalismo 

Influencias nacionalistas 

Otras influencias especiales, po- 
líticas o ideológicas 

Étnicas, diferencias culturales — 
diferencias entre gente (general) 
La consistencia de las culturas 
occidental y oriental 
Desacuerdo entre gente, descon- 
fianza, etc. 

Tensiones entre razas 

Otras diferencias especiales, cul- 
turales y étnicas 

Poderes históricos (general) 


Núm. Pregunta-Variable Columna Código Alternativas 


A 


62 El desarrollo científico 

63 El desarrollo social (sociedades 
más complejas, problemas demo- 
gráficos, migraciones, etc.) 

68 Otras tendencias históricas espe- 
ciales 

71 Moral-condiciones étnicas (gene- 
ral) 

72 Moral. Situación ética en el He- 
misferio Occidental 

73 Moral. Situación ética en el He- 
misferio Oriental 

78 Otras condiciones específicas de 
moral y ética 

81 Insuficiencia de las organizacio- 
nes internacionales (general) 


Aquí se puede pensar también en una ordenación dentro del código, como en este 
ejemplo: 
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Мйт. Pregunta-Variable Columna Código Alternativas 
Clase Social 13 1 Pudiente (acomodada) 
2 Clase media 
3 Obreros (trabajadores) y sus si- 
milares 
7 Ocupación 13-14 11 Dueños de fundo y arrendatarios 
de importancia 

12 Industriales 

13 Empresarios mayoristas 

14 Altos empleados de empresas 

15 Altos empleados públicos 

16 Profesiones liberales, ej.: aboga- 
dos, arquitectos, dentistas 

17 Propietarios de grandes hoteles y 
restaurantes 

18 Propietarios de edificios de de- 
partamentos, casas, etc. 

21 Agricultores (predio mediano), 
incluyendo parientes cercanos 
que trabajen en el fundo 

22 Empresarios artesanales 

23 Dueños de tienda, comerciante 
(pequeños) 

Мит. Pregunta-Variable Columna Código Alternativas 

24 Funcionarios de posiciones inter- 
medias en empresas 

25 Funcionarios públicos de catego- 
ría media 

26 Profesiones liberales y medias 

27 Empleados posición media en ho- 
teles y restaurantes 

28 Servicios domésticos (medias) 

31 Trabajadores agrícolas 

32 Artesanales (baja categoría) 

33 Trabajadores (actividades comer- 
ciales) 

34 Trabajadores (industria y mine- 
ría) : 

35 Funcionarios públicos de bajas 
posiciones 

36 Profesiones liberales (inferiores) 

37 Lavanderas, etc. 
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La primera cifra (correspondiente a la columna 13) da la ordenación de la ocupación, 
con respecto a clase (baja, media, alta) (tricotomización). La segunda cifra da el sector 
de trabajo. 

Entonces, el dueño de un fundo tiene el código 11, en columna 13-14; el subordinado 
21 y el trabajador agrícola 31. 

Otra manera de utilizar el espacio sería la siguiente: 


Núm. Pregunta-Variable Columna Código Alternativas 


8 ¿Es usted miembro de los 
siguientes clubes o asocia- 
ciones? En caso afirmativo, 
¿cuál es su posición den- 
tro del club? Club de de- 


portes 15-17 15:1  Perforado-Ip es miembro de la 
directiva 
16:1 ús -Ip tiene una misión 
especial dentro del 
club 
17:1 ы -Ip ез un socio со- 
rriente 


15-17:1 Sin perforar-Ip no es miembro 
de ningún club de de- 


portes 
9 Agrupación política 15-17 15:4  Perforado-Ip es miembro de la 
directiva 
16:4 ” -Ip tiene una misión 
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Núm. Pregunta-Variable Columna Código Alternativas 


especial dentro de la 
agrupación 

17:4 Perforado-Ip es miembro co- 
rriente 

15-17:4 Sin perforar-Ip no es miembro 
de ninguna agrupación 


política 
10 Liga de templanza 15-17 15:5 Perforado-Ip es miembro de la 
directiva 
16:5 я -Ip tiene una misión 
especial dentro de la 
liga 
17:5 е -Ip es miembro co- 
rriente 


15-17:5 Sin perforar-Ip no es miembro 
de ninguna liga de 


templanza 
11 Sociedad disidente 15-17 15:6  Perforado 
16:6 Ы Mismas alternativas 
17:6 "R 


15-17:6 Sin perforar-Ip no es miembro 
de ninguna sociedad 


disidente 
12 Sociedad religiosa (Iglesia 15:7 Регѓогадо 
del Estado) 15-17 16:7 ” Las mismas alternati- 
vas 
17:7 н 


15-17:7 Sin perforar-Ip по es miembro 
de ninguna sociedad 


religiosa 
13 Club musical o de canto 15-17 15:8  Perforado-Ip es miembro de la 
directiva 
16:8 "Ір tiene una misión 
especial dentro del 
club 
17:8 $ -Ip ез miembro co- 
rriente 
14 Cruz Roja 15-17 15:9 — Perforado 
16:9 о Las mismas alternati- 
vas 
17:9 hs 
15-17:9 Sin perforar-No pertenece a la 
Cruz Roja 


_—-+—————+—-—+——-+—-+— —гїГге е —э— е—_—+—+—+—+—+——————— 


Finalmente presentamos una solución aún un poco pesada con respecto al problema 
de múltiples alternativas. 
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Supongamos que necesitamos saber si el individuo entrevistado tiene algún 
conocimiento de idiomas extranjeros. Para facilitar la presentación, tomamos solamente 
la alternativa de si sabe leer los idiomas. Entonces, existe la posibilidad de que sabe leer: 
ninguno, uno, dos o más idiomas. Si sabe leer tres idiomas, pueden ser tres diferentes 


idiomas que maneja otro individuo, etc. 


Núm. Pregunta-Variable Columna Código 


15 ¿Qué idiomas sabe usted 01 
leer? 18-19 02 

04 

10 

20 

40 


Alternativas 


Inglés 
Francés 
Alemán 
Italiano 
Portugués 
Otros 


Este tipo de código está construido en la idea binaria de resolver el problema. Basta, 
entonces, con sumar las cifras indicadas para cada idioma y el código total va a ser el 


siguiente: 
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Núm. Pregunta-Variable Columna Código Alternativas 


01 Inglés 

02 Francés 

03 Inglés y francés 
04 Alemán 


05 Inglés y alemán 

06 Francés y alemán 

07 Inglés, francés y alemán 
10 Italiano 

11 Italiano e inglés 

12 Italiano y francés 

13 Italiano, inglés y francés 
14 Italiano y alemán 

15 Italiano, inglés y alemán 
16 Italiano, francés y alemán 
17 Italiano, inglés, francés y alemán 
20 Portugués 

21 Portugués e inglés 


22 y francés 

23 ё inglés y francés 

24 > y alemán 

25 ё inglés y alemán 

26 ч francés y alemán 

27 е inglés, francés y 
alemán 


30 Italiano y portugués 
31 Italiano, portugués e inglés, etc. 


Procedimiento de codificación 


Para Duverger,'% la codificación propiamente dicha consiste en “introducir cada 
respuesta en una de las diversas categorías definidas por el código”. Nosotros preferimos 
decir que consiste en atribuir a cada respuesta el símbolo numérico correspondiente a la 
categoría “definida del código” en que cae la respuesta. Asimismo, recordamos la 
mención de Selltiz, cuando decía que no es un procedimiento automático, sino que 
envuelve un juicio por parte del codificador. 

Por otra parte, esa tarea puede ser hecha no sólo por los codificadores, sino por los 
propios encuestadores en el momento del relevamiento, lo que nos obliga a dividir la 
discusión sobre el procedimiento de codificar según esta operación sea hecha por unos u 
otros. Lógicamente, nos importa describir con más detalle cómo se realiza la labor de los 
codificadores, en razón sobre todo del siguiente hecho: los datos de la ficha que se dejan 
para codificar luego del relevamiento son los más complejos y requieren un 
entrenamiento técnico adecuado por parte de la persona que va a codificarlos; pese a que 
los encuestadores también codifican, la clase y nivel de su adiestramiento es distinto del 
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de los codificadores y tiene relación directa con la técnica de la entrevista, problema que 
escapa al ámbito de este trabajo. 

Incluso podemos señalar un aspecto práctico de este dualismo en cuanto a las 
personas que codifican; en el lenguaje de los centros de investigación que conocemos en 
Uruguay, se llama codificación a la etapa que se efectúa luego del relevamiento, 
realizada por codificadores, aunque se codifica también durante el relevamiento. Esta 
manera de dominar esa segunda etapa es un buen reflejo de su mayor importancia frente 
a la codificación realizada por los encuestadores. 


Codificación que realiza el encuestador 


Según Selltiz,'! las ventajas que se derivan de esta forma de codificación son las 
siguientes: el encuestador está en una situación tal que le permite captar con acierto la 
respuesta del entrevistado; en virtud de ello, tiene más información sobre la cual basar su 
juicio, con relación al codificador que trabaja sobre la base de datos escritos; y este tipo 
de codificación ahorra tiempo y trabajo. “No obstante estas ventajas [anotan los autores 
mencionados], la categorización [nosotros diríamos codificación] de datos complejos es 
generalmente efectuada por codificadores después que los datos han sido relevados.” 


El procedimiento de codificación en la oficina 


Llamamos así a la codificación que realizan los codificadores, propiamente, a los solos 
efectos de distinguirla de la que realizan los encuestadores en el momento de la 
entrevista. 

El primer problema a considerar es el referente al entrenamiento de los codificadores. 
Por lógica, una correcta codificación de los datos obtenidos en el relevamiento tiene 
como supuesto previo el contar con un equipo de codificadores adecuadamente 
adiestrados. El periodo de preparación será más o menos largo, según la complejidad de 
los datos a codificar, y puede ser llevado a cabo antes, durante o después del 
relevamiento. Pero, como se comprende, es más prudente tener el elenco de 
codificadores entrenado de manera tal que pueda entrar en funciones inmediatamente 
después del relevamiento, evitando así pérdida de recursos económicos y de tiempo. 

Siguiendo a Selltiz, mencionaremos las etapas que deben transitarse en el 
entrenamiento de los codificadores. Asimismo señalamos que en esta parte, así como en 
el resto de la exposición, seguiremos de cerca a los autores que han desarrollado con 
extensión estos puntos, puesto que consideramos útil un planteamiento eminentemente 
práctico del tema. 

Las etapas fundamentales en el entrenamiento de codificadores serían las siguientes: 

En primer término, el código o los códigos a emplear son explicados e ilustrados con 
ejemplos extraídos del material a ser codificado. Los codificadores, entonces, practican 
sobre una muestra de los datos recogidos. Los problemas que surgen son discutidos por 
los codificadores en grupo, con el supervisor, con la finalidad de desarrollar 
procedimientos y definiciones comunes. 
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Frecuentemente, como resultado de esta práctica de codificación, las categorías ya 
establecidas son revisadas para hacerlas más aplicables al material relevado y para poner 
en práctica los procedimientos y definiciones que han sido desarrollados durante la 
codificación preliminar. 

En el periodo de práctica, cuando aparecen pocos problemas, los codificadores 
trabajan sobre una porción idéntica de los datos, sin consultar a los otros codificadores o 
al supervisor. La consistencia y precisión de la codificación es entonces computada para 
determinar 51 es factible comenzar a codificar formalmente. 


Por su parte, Chevry,'? bajo el título “Dificultades de la codificación”, nos dice: “La 
codificación es una operación que presenta dificultades extremadamente variables, según 
la naturaleza de las preguntas hechas, la calidad de las respuestas y la complejidad del 
código utilizado”. 

A su juicio, las dificultades que pueden plantearse tienen, generalmente, una o más de 
las siguientes causas: el concepto que se posea del asunto u objeto a codificar: “para 
servirse eficazmente de un código de diplomas universitarios, es indispensable tener una 
idea bastante precisa sobre la organización de la enseñanza”. Otra dificultad la plantea la 
nomenclatura en sí misma. Sostiene que, por más cuidado que se tenga en la confección 
de las grandes nomenclaturas, éstas “no son jamás suficientemente precisas y completas 
para que su empleo no pueda dar lugar a dudas y a dificultades de interpretación”. En 
tercer término, la gran variedad de dificultades que pueden presentarse en las 
codificaciones, así como el carácter muy especial de alguna de ellas. 

Esto último ha llevado a los servicios oficiales de estadística, que deben hacer 
codificaciones numerosas y variadas, a clasificarlas según su grado de dificultad y a 
especializar su personal, fundamentalmente, en dos aspectos: en presencia de 
cuestionarios que comportan numerosas preguntas en las cuales la codificación presenta 
dificultades desiguales, no se pide a la misma persona que codifique todas las 
preguntas... de tal modo que las codificaciones más simples sean confiadas al personal 
novato y las más difíciles al personal más capaz y mejor formado. 

En segundo término, “es aconsejable que las codificaciones particularmente 
delicadas, como las causas de deceso o actividades económicas, sean siempre confiadas 
a las mismas personas especialmente formadas a este efecto y que adquieren de este 
modo una competencia que garantiza a la vez la calidad y la rapidez de su trabajo”. 

Pasando ahora a los aspectos referidos concretamente al procedimiento de la 
codificación, mencionaremos a Hyman, quien detalla las instrucciones para los 
codificadores empleados en el National Opinion Research Center: 


La regla fundamental en codificación es: sea cuidadoso. Si usted asigna un código 
equivocado a una respuesta o escribe sus números de modo tan ilegible que el 
puncher —persona que realiza la tarea de trasladar los datos codificados a tarjetas 
perforadas— los interpreta equivocadamente, los pone en una columna que no 
corresponde, los resultados del survey son distorsionados. De tal modo, nosotros le 
indicaremos las siguientes reglas generales a seguir: /) Use lápiz rojo; 2) Escriba sus 
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números claramente; 3) No borre. Tache el material incorrecto. 


A continuación se mencionan instrucciones para trabajar con dos tipos de preguntas: 
preguntas precodificadas, es decir, el tipo de preguntas cerradas que son directamente 
codificadas por el encuestador; y preguntas abiertas, vale decir, aquellas cuya 
codificación se realiza en la oficina. 

Como se comprende, para el tipo de preguntas precodificadas la labor del codificador 
consiste en revisar si el dato ha sido bien relevado, y algunas de sus tareas, a título de 
ejemplo, son las siguientes, según Hyman: 

Primera: comprobar que cada pregunta que debía hacerse ha sido realmente hecha y 
que el casillero correspondiente (con el número de código ya asignado) ha sido marcado. 

Segunda: comprobar que una determinada pregunta no ha sido hecha si no 
correspondía efectuarla. 

Tercera: en caso de que el encuestador haya marcado erróneamente el casillero que 
corresponde a una respuesta, el codificador debe enmendar la codificación. 

Cuarta: si el encuestador pasa por alto una pregunta que debía ser hecha, el 
codificador debe colocar el símbolo correspondiente a “pregunta no hecha”, “sin dato”, 
etc. Tanto la denominación como el símbolo para codificar este tipo de pregunta “en 
blanco” varían según los investigadores, no existiendo un acuerdo general sobre la 
cuestión. De cualquier manera, conviene señalar que comúnmente se utiliza la letra Y 
para las preguntas no hechas, símbolo que corresponde al número 11 en las tarjetas 
perforadas tipo IBM, y la letra Х para las preguntas acerca de las cuales no pudo obtenerse 
información (sin dato), símbolo que corresponde al número 12 de las tarjetas; para este 
último caso, se emplea también en forma habitual directamente el número 12, símbolo 
que es cada vez más general para codificar “sin dato”. 

Quinta: si el encuestador omitió marcar el casillero correspondiente, pero escribió lo 
que el entrevistado dijo, el codificador debe leer los comentarios y, si éstos lo permiten, 
escribir el número pertinente; en caso contrario, debe codificarse o bien “no sabe” o bien 
“sin dato”. 

Por último, si el encuestador ha marcado dos casilleros pertenecientes a la misma 
pregunta y no hay comentario alguno escrito sobre la cuestión, que permite saber qué 
número de código corresponde, debe codificarse “по sabe”. 

El resto de la tarea de contralor de la codificación realizada por los encuestadores 
compete más directamente a los procedimientos generales de revisión a que es sometida 
una ficha de encuesta, a la que nos referiremos más adelante; en los hechos, escapa a la 
tarea propia de los codificadores. 


Instrucciones para la codificación de preguntas abiertas 


Como ya señaláramos, la codificación de preguntas abiertas —ya sean de hecho o de 
opinión— puede ser efectuada directamente en la ficha de encuesta o en una hoja u hojas 
separadas. 


142 


Siempre con base еп el libro de Hyman,!'* veremos algunos aspectos de la 


codificación de preguntas abiertas. Es importante, en este caso, familiarizarse no sólo 
con el código, sino además con las diferentes categorías en que se dividió cada pregunta, 
de modo tal que no haya dudas acerca de la codificación de las respuestas. 

Siempre que corresponda hacer la pregunta y ésta haya sido contestada, debe 
efectuarse la codificación. En el caso de respuestas totalmente inadecuadas a la pregunta 
—lo que, de paso, revelaría una deficiencia del encuestador que relevó los datos—, no 
puede dejar de codificarse con el pretexto de que no se puede ubicar con precisión la 
respuesta de una categoría. 

Deben codificarse las ideas y no las palabras. El codificador no puede pretender 
encontrar, en la definición y ejemplos de las categorías pertinentes a la respuesta a la 
pregunta, la frase o frases que correspondan exactamente con la respuesta del 
entrevistado. 

Generalmente, se coloca una categoría denominada “otras respuestas” en cada 
pregunta (sobre todo en las preguntas abiertas de opinión) para prever la probabilidad de 
que una respuesta no pueda ser codificada dentro de las otras categorías establecidas; 
pero no deben colocarse en esta categoría todas aquellas respuestas vagas, ininteligibles, 
etc. Deben ubicarse las que signifiquen posibilidades nuevas de respuestas, no previstas 
en el elenco de categorías. La categoría “otras respuestas” cumple, fundamentalmente, la 
siguiente función: si el número de respuestas que entran en esta categoría es muy 
elevado será necesario crear nuevas categorías y revisar la división de categorías 
original. 


Procedimientos administrativos. Algunos ejemplos 


Además de las instrucciones y procedimientos de orden técnico en el trabajo de 
codificación, el mismo implica una organización y procedimientos administrativos: 
organización y control del trabajo de los codificadores, distribución de tareas, manejo y 
control desde el punto de vista del desplazamiento interno de las fichas de encuesta, 
etcétera. 

Transcribiremos los aspectos sustanciales que menciona Hyman bajo el título 
“Procedimientos administrativos”: 


Los cuestionarios son numerados a medida que son recibidos y agrupados en 
paquetes de 100 (cuestionarios) cada uno. Un paquete es la unidad con la cual usted 
trabajará en un tiempo dado. Como regla general, los codificadores deberán codificar 
sólo una página de un paquete determinado. De esta forma se familiarizan con el 
código de las preguntas de esa página más rápidamente que si tuvieran que codificar 
el total del cuestionario al mismo tiempo. 

Hemos establecido varias normas referentes a las operaciones de codificación, las 
cuales le pedimos que observe: 

1. Si tiene dudas acerca de qué número de código colocar en un cuestionario, 
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consulte al supervisor, no a sus compañeros codificadores. 

2. Si desea consultar al supervisor un problema de codificación, espere hasta 
terminar un paquete sobre una página determinada. 

3. Por favor, mantenga en un mínimo las discusiones durante el periodo de trabajo. 

4. Es responsabilidad de los codificadores de la página 1 asegurarse de que el 
cuestionario ha sido correctamente procesado. La siguiente revisión debe ser hecha 
por aquellos que codifican la página 1: a) Ver que el cuestionario esté 
adecuadamente clasificado (stapled). b) Ver que cada cuestionario tenga asignado un 
número y que no haya números omitidos o duplicados. Cualquier deficiencia en la 
numeración debe ser informada de inmediato al supervisor, c) Reescriba cualquier 
número de un cuestionario que sea ilegible. 

3. Los codificadores, en general, deben vigilar la existencia de páginas duplicadas 
u omitidas en el cuestionario. 

6. Todo el material es considerado confidencial. 


Procedimiento de revisión y control 


Durante o después de la etapa de codificación, los propios codificadores u otras personas 
—más especializadas y con mayor dominio de la ficha de encuesta— son requeridos 
para revisar la codificación que se ha efectuado. En general, no se controlan todos los 
cuestionarios, lo que demandaría mucho tiempo, sino un cierto porcentaje de ellos: un 
tercio, un medio, etc. Más que la corrección de los errores cometidos, lo que interesa es 
conocer el porcentaje de los mismos en el conjunto de cuestionarios; a este porcentaje se 
le denomina “margen de error” (téngase presente que aquí hablamos de “margen de 
error” en la codificación de los datos). El margen de error que puede admitirse varía de 
una investigación a otra y se fundamenta en consideraciones metodológicas que no es 
pertinente discutir aquí. Interesa señalar que, en esta etapa, el cuestionario es sometido a 
lo que se denomina crítica de consistencia interna: se trata de verificar que todas las 
respuestas al cuestionario sean congruentes entre sí, vale decir, por ejemplo, que una 


persona de 24 años no aparezca luego como casada 15 años atrás. Para Chevry:!* 


La codificación de los cuestionarios debe ser objeto de una verificación consistente 
en hacer revisar el trabajo realizado por una empleada más calificada que la 
codificadora y capaz, por consiguiente, de rectificar los errores que esta última ha 
podido cometer. Pero es evidente que entendida de este modo la verificación de la 
codificación sería un trabajo muy oneroso, pues casi doblaría el costo de la 
codificación en sí misma. Como consecuencia, se limita a menudo, cuando se trata de 
trabajar con grandes masas de documentos: 

Sea a la verificación de las codificaciones más importantes y más difíciles, sea a 
verificar nada más que una parte de los cuestionarios y a seguir la calidad del trabajo 
de cada codificadora merced a una verificación por sondeo de los documentos que le 
han sido confiados. Se asegura de este modo que el porcentaje de errores que comete 
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la codificadora no pase de una tasa que se ha fijado de antemano, y se procede a una 
verificación integral de los lotes de documentos para los cuales ella hubiera pasado 
esa tasa. Bien entendido, este procedimiento no permite rectificar todos los errores de 
codificación; tiene sin embargo la ventaja de ser económico y limitar el porcentaje de 
errores residuales a un nivel admisible. 

Para evitar errores de codificación que introducen anomalías e incompatibilidades 
muy difíciles de descubrir y corregir más tarde, es muy recomendable proveer a las 
verificadoras y eventualmente a las codificadoras de tablas de incompatibilidades. 


Señalamos, finalmente, que para la revisión y control se aconseja emplear una hoja 
aparte y separada de la de codificación, en la que el encargado de esta labor anota sus 
desacuerdos, las omisiones, errores de la codificación original, etcétera. 

Para terminar nuestra discusión de los procedimientos de revisión y control, 


transcribiremos algunas de las consideraciones que menciona Selltiz, !? bajo el título de 
“Problemas de la confiabilidad en la codificación”: 


Cada entrevista o cédula de observación debe ser revisada para: 

1) Completarla. Todos los ítems deben ser llenados. Un claro a continuación de 
una pregunta en una cédula de entrevista puede significar “no sabe”, “rehúsa 
contestar”, o que la pregunta no es pertinente, que la pregunta fue omitida por error, 
etc. Para nuestros propósitos, es importante ser capaz de distinguir entre estos 
significados potenciales. 

2) Hacerla legible. Si el codificador no puede descifrar lo que ha escrito el 
encuestador u observador, o las abreviaturas o símbolos empleados por el mismo, la 
codificación se torna imposible. 

3) Hacerla comprensible. Frecuentemente una respuesta parece perfectamente 
comprensible al encuestador u observador, pero no lo es para otro. El contexto en el 
cual la conducta o respuesta ocurre es conocida por el encuestador, pero no por el 
codificador, quien de este modo no puede ver exactamente lo que el sujeto hizo, o 
comprender lo que su respuesta significa. Preguntas sistemáticas al encuestador u 
observador disipan confusiones у ambigijedades, mejorando considerablemente la 
calidad de la codificación. 

4) Hacerla consistente. Marcadas inconsistencias en una cédula de entrevista u 
observación dada no sólo crean problemas en la codificación: pueden indicar errores 
en la recolección y registro de los datos... puede ser deseable tomar contacto 
nuevamente con el entrevistado si el punto es importante para el análisis de los datos. 

3) Uniformarla. En conjunto, de adecuadas instrucciones a los encuestadores u 
observadores resultarán procedimientos uniformes en la recolección y registro de los 
datos; sin embargo, es necesario verificar la uniformidad con que estas instrucciones 
fueron seguidas. 


Tiempo necesario para la codificación. Errores residuales 
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Antes de terminar este trabajo parece de interés transcribir algunos párrafos de dos 
puntos que Chevry estudia: a) Tiempo necesario de la codificación; y b) Errores 
residuales. 


Tiempo necesario de la codificación 
Я ‚ 16 
Dice Chevry:, 


Es pues absolutamente necesario, cuando se establece el plan de una encuesta 
importante, que se pueda evaluar bien, antes de la encuesta, y con una precisión 
suficiente, el tiempo que será necesario para asegurar la codificación de los 
cuestionarios, el costo de cuya operación representa una parte importante del 
presupuesto global de una encuesta. Si esta evaluación previa ha sido demasiado 
optimista, podemos encontrarnos con muy poco dinero cuando se trate de acabar la 
elaboración. Es necesario organizar la codificación con el mayor cuidado para 
efectuarla tan rápida y económica como sea posible. Se utilizarán a este efecto todos 
los medios que permitan mejorar el rendimiento de las codificadoras: división del 
trabajo, circulación de los documentos, equilibrio de los diferentes grupos previstos 
para evitar superposiciones, consignas claras y precisas, reenvío de casos difíciles o 
dudosos a los cuadros especialmente formados, etcétera. 


Errores residuales 


A este respecto Chevry señala: 


A pesar de todo el cuidado puesto en las diferentes operaciones que hemos descrito, 
los cuestionarios codificados llevarán todavía un cierto número de errores de diversos 
orígenes: los errores que comportan las respuestas de las encuestas y que no hubieran 
sido eliminados por la verificación de los cuestionarios. Los errores de codificación 
que hubieran escapado a su verificación. Debe notarse a este propósito que un cierto 
número de estos errores no tienen ninguna posibilidad de ser corregidos si la 
verificación de la codificación ha sido hecha por sondeo. Estos errores sin embargo 
pueden ser clasificados en diferentes categorías según su frecuencia y según la 
influencia que tuvieron en los resultados de las clasificaciones. 

a) Cierto número de esos errores pasará siempre inadvertido porque nada podrá 
revelar su existencia, ni permitir su localización. Será el caso de errores —a 
condición de que sean poco numerosos— que en los cuadros de resultados afectarán 
en más o en menos los casos donde deben figurar normalmente números 
relativamente importantes. Ningún control de verosimilitud permitirá detectarlos. Por 
lo demás, su presencia se traduce por errores relativos muy débiles, que tienen poca 
importancia. 

b) No será igual cuando los errores, aun poco numerosos, afecten casos donde 
deben normalmente encontrarse números muy débiles. Un número absoluto de 
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errores muy poco importante puede entonces doblar, triplicar o, al contrario, reducir a 
cero al número que debería figurar en la casilla afectándolo en consecuencia con un 
error relativo considerable. 

c) Ciertos errores que fueron cometidos muy frecuentemente porque tomaron un 
carácter sistemático podrán crear una anomalía muy visible en los cuadros 
estadísticos de resultados, lo cual proveerá, para ciertos casos, un número de 
unidades que aparecerá muy poco verosímil. 

d) En fin, otros errores tendrán como resultado hacer figurar un pequeño número 
de unidades en una casilla de un cuadro donde no debería encontrarse ninguno, en 
razón de la naturaleza misma de las cosas, porque hay incompatibilidad fundamental 
entre los valores de los dos caracteres de los cuales esta casilla representa el 
cruzamiento. 

Supongamos, en efecto, que una codificadora ha atribuido a una cierta profesión 
individual el número de código de otra profesión. Si este error es raro y no ha sido 
descubierto por la verificación, peligra no poder ser descubierto ulteriormente (caso 
a), a menos que tuviera por resultado hacer aparecer un pescador, por ejemplo, en 
una región donde esta profesión individual no tiene ninguna razón de estar 
representada (caso d). 

Pero, si se trata de un error sistemático de codificación cometido numerosas veces, 
tendrá por efecto engrosar en gran medida el número de unidades que figuran en la 
casilla que corresponde a la profesión efectivamente codificada y reducir otro tanto el 
número de unidades que figuran en la casilla de la profesión verdadera (caso c). En el 
curso de un control de verosimilitud de los resultados, estos dos números podrán 
aparecer muy sospechosos, el primero por su importancia, el segundo por su 
debilidad. 

Por otra parte, si la situación matrimonial 4 (divorciado) ha sido atribuida a una 
muchacha de 12 años, o aun si el status profesional 2 (empleador) ha sido dado a una 
persona cuya categoría socioprofesional ha sido codificada 60 (capataz), aparecerá 
una unidad en una casilla de los cuadros: 


— repartición según la edad y el estado matrimonial, en el primer caso; 
— repartición según la categoría socio-profesional y el status, en el segundo caso; 


que debería permanecer absolutamente vacío porque hay incompatibilidad 
fundamental entre las modalidades de los caracteres en cuestión (caso d). 


El tratamiento de otras cuestiones relativas a la codificación, tales como la 


construcción de índices y coeficientes, diversas modalidades que la codificación adopta 
en el caso de otros instrumentos de relevamiento distintos del cuestionario (análisis de 
contenido, entrevista focalizada, técnicas sociométricas, etc.), demandaría un esfuerzo de 
estudio que no pretendemos explorar aquí. Si bien resultaría interesante, puesto que son 
temas poco transitados en la literatura sociológica. 


De cualquier manera, en el apéndice se discuten algunos puntos conectados con la 
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codificación y no mencionados en el presente trabajo. 

Sin duda, los problemas tratados en dicho apéndice, muy sumariamente, admiten una 
elaboración más pormenorizada y un nivel de profundidad mayor. Pero lo que se 
pretendió con él es dejar abierta la posibilidad de ulteriores desarrollos sobre los temas a 
que se hace referencia. 


APÉNDICE 


1) La utilización de símbolos numéricos 


Como ya se ha dicho, los símbolos numéricos no son de empleo obligatorio en las tareas 
de codificación; puede admitirse que los símbolos usados sean de naturaleza muy 
diversa. Además de los números, pueden emplearse letras, signos algebraicos, 
determinados cortes o perforaciones en una tarjeta, colores, rayas de diversos colores, 
etcétera. 

Si debemos codificar sexo, por ejemplo, podemos adoptar como código el siguiente: 
en la tarjeta a la que trasladaremos los datos del instrumento de relevamiento haremos un 
corte en la esquina superior derecha para los varones y no haremos ninguno para las 
mujeres. Este simple artificio nos permite, por medio de símbolos muy sencillos, 
proceder a la codificación de la variable sexo, así como una rápida individualización, e 
incluso separación, de las tarjetas que caen en uno u otro ítem. Obsérvese que en los 
sanatorios las fichas de los recién nacidos son impresas en cartulinas de distinto color, 
según el sexo. Esto también implica que estamos clasificando al recién nacido en una de 
las dos clases en que se divide la variable sexo y de este modo la estamos codificando 
por medio de un determinado color; vale decir, estamos empleando símbolos cromáticos 
para codificar. 

El elenco de símbolos puede ser aún mayor; pero los ejemplos mencionados, al 
parecer, alcanzan para mostrar algún aspecto nuevo referido a los símbolos en la 
codificación. 


2) Codificación y cuadros bidimensionales 


En este parágrafo se pretende mostrar, en líneas muy generales, algún aspecto de la 
utilidad que la codificación puede prestar en la tarea de tabulación de datos para la 
construcción de cuadros bidimensionales. 

Supongamos que en el plan de explotación de una investigación está previsto el 
cruzamiento de dos variables dicotomizadas: sexo y adhesión a uno de dos partidos 
políticos. En lugar de relevar los datos de las dos variables por separado, diseñamos las 
dos preguntas conjuntamente: 
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Sexo y adhesión a partido político 
Masc. Partido A 1 
Masc. Partido B 
Fem. Partido A 
Fem. Partido B 


Masc. Sin respuesta 


с мл ъъ uu N 


Fem. Sin respuesta 


Cada uno de los números de código asignados a cada respuesta combinada 
corresponde a cada uno de los casilleros del cuadro a construir en la tabulación de los 
datos. Dicho cuadro sería como sigue: 


Al elaborarse los datos obtendríamos directamente los resultados correspondientes a 
dos preguntas, lo que facilitaría en buena medida los trabajos de tabulación. 

Por cierto que el ejemplo es sumamente sencillo y pueden pensarse soluciones para el 
cruzamiento de más de dos variables y no solamente dicotomizadas. Pero parece 
suficiente el ejemplo si de lo que se trata es de presentar una posible utilización de la 
codificación más allá de su empleo corriente. 


3) Codificación y escalas 


Aunque la construcción de escalas para su utilización en las investigaciones sociológicas 
está en sus inicios, puede hacerse alguna referencia a la relación entre escalas y 
codificación. Esta relación es evidente cuando se trata de dimensiones claramente 
cuantitativas (o cuantificables), a saber, ingresos, edad, años que se desempeña una 
ocupación, etc. Si las respuestas a una pregunta sobre ingresos las categorizamos en 
ingresos de 0 a $ 1 000, de $ 1 000 a $ 2 000 y de $ 2 000 y más, y le asignamos al ítem 
primero el número 1, al que sigue el 2 y al último el 3, cada número de código 
corresponderá a un intervalo de la escala; la posición de un sujeto o un grupo de ellos 
estará dado por el número de código que le corresponda. 
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El problema es más complejo si queremos indagar acerca de la posible utilización de 
la técnica de la codificación referida a aquellas dimensiones más difíciles de cuantificar, 
por ejemplo, frente a la dimensión poder. La igualación de los intervalos de la escala, la 
determinación del cero son problemas que se plantean frente a este tipo de dimensiones 
y, por lo tanto, resulta más problemático usar la codificación provechosamente en estos 
casos. De cualquier modo esta posibilidad siempre existe, y su empleo, en el futuro, 
puede resultar en un considerable ahorro de esfuerzo en los trabajos de elaboración. 


4) Codificación y tabulación manual 


Transcribiremos lo que en Manual de métodos para la elaboración de datos se dice al 
respecto: 


Codificación. Es útil describir algunas técnicas comunes de codificación empleadas 
en el sistema de separación manual de tarjetas perforadas. Puede usarse el fichero 
para seleccionar las tarjetas, para su arreglo en un cierto orden о para ambos 
propósitos. El tipo de código empleado está considerablemente influido por el uso 
principal que se dé al fichero. Los códigos deberán ser fáciles de usar y deben 
permitir el logro del máximo de rapidez y de eficiencia en las operaciones de 
separación. A continuación se describen algunos de los sistemas importantes de 
codificación: 

a) Codificación directa o simple por ranuras. Se asigna un orificio a cada clase 
requerida. Así, el número de clases que pueden ser ranuradas en una tarjeta será igual 
al número de orificios ranurables en dicha tarjeta (sin contar las posiciones de las 
esquinas, que normalmente no se ranuran). Por lo tanto, es limitado el número de 
características que pueden codificarse en una tarjeta por medio de este método. Sin 
embargo, cuando la selección es simple y la tarjeta tiene lugar suficiente para todas 
las clases requeridas, es preferible usar la codificación directa. 

b) Codificación combinada. En este método de codificación generalmente se 
asigna más de un orificio, en una combinación adecuada, a cada clasificación, dígito 
o letra. Usando códigos combinados y también codificando adecuadamente las 
clasificaciones, puede aumentarse considerablemente la cantidad de grupos que es 
posible ubicar en una tarjeta. Generalmente se usa este método de codificación 
cuando las características codificadas exceden el número total de orificios ranurables. 
Con una codificación combinada, el fichero puede ordenarse en una secuencia 
numérica, con menos pasadas de la aguja separadora (es decir, manipulando las 
tarjetas un menor número de veces) que las necesarias con un código directo. Por esta 
razón, este método de codificaciones es útil cuando las tarjetas tienen que ser 
ordenadas en una secuencia numérica o alfabética. 

La combinación de los códigos, generalmente empleada para la codificación 
numérica y alfabética, puede derivarse de una interesante propiedad de la serie 
geométrica: 1, 2, 4, 8, 16, ..., con término general 2”. Podrá notarse que las 


150 


combinaciones de diferentes términos de esta serie dan todos los enteros positivos; y 
cualquier término es mayor en una unidad que la suma de todos los otros términos 
anteriores. Los cuatro primeros (1, 2, 4, 8) dan, en combinaciones diferentes, todos 
los enteros positivos desde 1 hasta 15; por ejemplo, el número 7 se obtiene sumando 
1, 2 y 4. Cualquier otro número puede obtenerse en una, y solo una, forma, es decir 
que hay solamente una forma de obtener 13, usando 8, 4 y 1. 

En forma similar 1, 2, 4, 7 dan todos los enteros positivos desde 1 hasta 9, 
combinando no más de dos de cualquiera de estos números. Esto elimina el que 7 sea 
obtenido de 1, 2 y 4. Cualquier entero entre 1 y 9 puede situarse, por tanto, en 
cualquier grupo de 4 orificios consecutivos, asignándole a cada orificio uno de los 
cuatro valores y ranurando uno o dos de estos dos orificios. El cero queda 
representado no ranurando ninguno de ellos, o ranurando 4 y 7. De esta manera, en 
lugar de necesitarse 9 orificios para representar los enteros entre 1 y 9, son 
suficientes solamente 4. La siguiente figura ilustra un “cinco” ranurado en el campo 
de las unidades. 


7 4 2 1 


campo de un dígito 


Si se desea codificar en tal forma que cada dígito pueda seleccionarse solamente 
con dos pasadas de la aguja, entonces es necesario asignar para cualquier dígito dos 
orificios para ranurar. Todo lo que hay que hacer para tener los dígitos entre 1 y 9 es 
sumar dos números del conjunto 0, 1, 2, 4, 7, mientras que el cero puede obtenerse 
ranurando 4 y 7. De simples reglas de combinación de álgebra, se sabe que de cinco 
orificios pueden obtenerse 10 combinaciones diferentes tomando dos orificios para 
cada combinación. Por tanto, cualquiera de los 10 dígitos (de 0 a 9) puede perforarse 
en cinco orificios, ranurando dos orificios, y puede emplearse un esquema triangular 
o, enrejado para mostrar el grupo de dos, de entre los cinco orificios, que debe 
ranurarse para obtener cada dígito particular. A continuación se muestra un esquema 
ilustrativo. 
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Los dos orificios que deben ranurarse para cualquier dígito son aquellos en los 
cuales terminan los dos conjuntos de celdas alineadas del enrejado, que contienen al 
dígito. Así, por ejemplo, los orificios a ranurar para 9 son II y IV, como se muestra 
por medio de las flechas. Si se emplean códigos visuales, en forma de enrejado, 
entonces la asignación de los dígitos a las diferentes celdas requiere algún cuidado, 
pues la clasificación del archivo según una secuencia numérica puede presentar 
algunos problemas. El modelo presentado arriba ha sido diseñado para facilitar la 
secuencia de la separación, haciendo corresponder І, П, Ш, IV y У, respectivamente, 
соп 1, 2, 4, 7, 0. 


3) Codificación y cuestionario 


Veremos a continuación, a través de las palabras de Chevry,!” algún tipo especial de 
cuestionario en el que la codificación adopta modalidades diferentes de las vistas en el 
trabajo: 


Conviene mencionar dos modalidades de presentación de cuestionarios que permiten 
hacer leer por una máquina las respuestas a las preguntas. En el primero, sistemas 
mark sensing (IBM) y magneto-lectura (Bull), la máquina que lee las respuestas las 
traduce en perforaciones en una tarjeta perforada normal que en seguida es explotada 
por las máquinas clásicas (clasificadora, tabuladora, etc.). En el segundo, llamado 
FOSDIC, de invención más reciente, las respuestas son traducidas mecánicamente, y 
sin la mediación de tarjetas perforadas, en signos sobre bandas magnéticas que serán 
explotados por calculadoras electrónicas. 


Solamente transcribiremos la explicación de Chevry referente a la primera modalidad: 
Los cuestionarios son impresos en tarjetas perforadas del formato clásico de 80 
columnas (187.3 x 82.6 mm), o tarjetas de formato más grande. Las preguntas son 


dispuestas en columnas yuxtapuestas y son transcritas con la ayuda de un lápiz 
especial en los lugares previstos a este efecto en la columna reservada a cada 
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pregunta (de ahí el nombre de “grafitado” dado a esta transcripción). En el sistema 
mark sensing el grafitado consiste en marcar con un trazo el eje mayor de un óvalo. 
En el sistema Bull de magneto-lectura, los lugares donde debe hacerse el grafitado 
son pequeños cuadrados que llevan en su interior una cifra o una letra en trazo ligero 
y el grafitado consiste en reescribir con un lápiz especial esa cifra o letra, o, más 
simplemente, trazar las diagonales del cuadrado. En cada columna reservada a una 
pregunta, habrá tantos óvalos o rectángulos como respuestas posibles a esta pregunta. 
Si la respuesta debe expresarse por un número, habrá tantas columnas de óvalo o de 
rectángulos marcados de 0 a 9 como números de cifras significativas. Ejemplos: a) La 
pregunta “sexo” se presentará de la manera siguiente: 


IBM BULL 
Sexo Sexo 
M M 


O 


EN [e] 


y el registro de la respuesta consistirá en marcar con un trazo el eje mayor del óvalo 
pertinente o trazar las diagonales del rectángulo M o F. 

b) La pregunta “año de nacimiento”, en la inteligencia de que no se retendrá nada más 
que las dos últimas cifras, se presentará de este modo: 


IBM BULL 


Año de nacimiento Año de nacimiento 


оа O H 


y la inscripción del año 1917 se hará marcando el óvalo (o el rectángulo) 1 en la 
columna de la izquierda y el óvalo (o el rectángulo) 7 en la columna derecha. Las 
tarjetas-cuestionarios de este modo grafitadas pasan en seguida por una máquina 
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reproductora, provista de un dispositivo especial que lee los trazos de lápiz y los traduce 
inmediatamente en perforaciones en la misma tarjeta. 
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VI. ESCALAS PARA LA MEDICIÓN DE ACTITUDES 


JORGE PADUA 
INGVAR AHMAN 


EL PROPÓSITO de este capítulo es presentar una serie de escalas —conocidas como 
escalas para la medición de actitudes— pero que de hecho pueden ser utilizadas para 
mediciones de otras variables. 

La idea principal es posibilitar al lector la construcción de cada una de ellas, 
indicando los diferentes pasos con los mayores detalles. Como en los capítulos 
anteriores, recomendamos al lector interesado en el tema recurrir a la bibliografia que 
detallamos al final del capítulo. 

Previamente a la presentación de cada tipo de escala conviene realizar una serie de 
aclaraciones que son importantes tanto para la construcción de las escalas como para la 
interpretación de sus resultados: 


1) La primera disquisición tiene que ver con el problema de la medición. Si bien en otro 
capítulo de este libro presentamos los diferentes niveles de medición en forma más 
extensa, interesa aquí dar un resumen sobre lo que se entiende por “medir” en ciencias 
sociales. La medición, de hecho, corresponde a una serie de teorías conocidas como 
niveles de medición: detrás de cada uno de los distintos niveles de medición están 
operando una serie de principios logicomatemáticos, que van a determinar o no el 
isomorfismo entre un concepto y el nivel de medición apropiado; es decir, el problema 
de la medición es expresado aquí como un problema en el cual se busca que el modelo 
matemático sea isomórfico con el concepto; esto es, que la “forma” del modelo sea 
idéntica a la “forma” del concepto. Si esto no ocurre (recuérdese que no hay 
isomorfismos “parciales”), estamos deformando el concepto (por ejemplo, si aplicamos 
niveles o modelos matemáticos intervalares a conceptos solamente operacionalizados a 
nivel ordinal es muy probable que los resultados ulteriores sean una consecuencia más 
del modelo matemático que del concepto en sí). Los niveles de medición más utilizados 
en ciencias sociales son: 

a) Nivel nominal: la operación de medir consiste simplemente en la asignación de 
nombres o de números a distintas categorías. La función del número en este nivel de 
medición es muy elemental, ya que simplemente sirve para distinguir diferentes 
categorías. A este nivel se está “midiendo” cuando, por ejemplo, se hace la distinción 
entre varón y mujer o entre católico, protestante, judío, mahometano o de otra religión. 
La operación de medición consistiría entonces en referir la observación a una clase o 
categoría, para luego contar cuántas frecuencias caen dentro de cada categoría. Uno no 
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puede hacer legítimamente ninguna afirmación que vaya más allá de las diferentes 
distinciones. 

Б) Nivel ordinal: en este nivel de medición uno está en condiciones de distinguir entre 
diferentes categorías y de poder afirmar si una categoría posee en mayor, menor о igual 
grado el atributo que estamos midiendo. La escala de jerarquía militar en el ejército es un 
buen ejemplo: un sargento tiene menos autoridad y es diferente de un teniente; éste a su 
vez tiene menor grado de autoridad que un capitán. Uno puede ordenar entonces las 
categorías sargento, teniente, capitán, con respecto a autoridad de la siguiente manera: 


Capitán > Teniente > Sargento 


Incluso puede llegarse a establecer comparaciones con distribuciones de autoridad 
para distintas categorías en la marina o las fuerzas aéreas, etcétera. 

c) Nivel intervalar: existe aún mayor precisión que en los anteriores, ya que no 
solamente podemos categorizar y establecer relaciones de mayor, menor o igual, sino 
además calcular la distancia entre los intervalos o categorías. Obsérvese que en el caso 
de las mediciones de nivel ordinal uno puede afirmar que un sargento tiene menos 
autoridad que un teniente, y que un capitán tiene más autoridad que éste; sin embargo, 
no estamos en condiciones de precisar cuánto más о cuánto menos. Mediante la 
adjudicación de un cero arbitrario en esta escala podemos especificar la distancia entre 
esas categorías. 

d) Nivel racional: es la forma de medición que utiliza valores cero absolutos, y que 
nos permiten establecer diferencias entre cualquier par de objetos a un máximo de 
precisión. A esta escala pertenecen el sistema métrico y el de pesos, por ejemplo. La 
diferencia entre el nivel intervalar y el nivel racional es que, por ejemplo, en la medición 
de la temperatura en que se utiliza escala intervalar, no es posible afirmar correctamente 
que cuando se registran 40 grados de temperatura estamos sintiendo el doble de calor 
que cuando teníamos 20 grados; por el contrario, si nos desplazamos 40 kilómetros en 
línea recta sí podemos afirmar que hemos duplicado la distancia recorrida al 
desplazarnos 20 kilómetros. 

La mayor parte de las escalas de medición de actitudes que vamos a describir se 
encuentran comprendidas entre la escala ordinal y la escala intervalar. 


2) La segunda disquisición a considerar también ha sido tratada en otro capítulo. Tiene 
que ver con la dimensionalización de los conceptos. (Ver “El proceso de investigación”.) 
Recordemos solamente que muchas de las variables con las que trabajan los científicos 
sociales son complejas y están compuestas de una serie de dimensiones o atributos. Por 
ejemplo, la variable “religiosidad” puede ser concebida como compuesta de tres 
dimensiones: dogmatismo, misticismo, ritualismo, cada una de las cuales tiene distintos 
indicadores. O la del status socioeconómico, que tradicionalmente se dimensionaliza en 
ocupación, educación e ingreso. El investigador en general espera que las dimensiones 
estén intercorrelacionadas, es decir, uno espera que una persona con alto grado de 
religiosidad manifieste valores altos en las dimensiones ritualismo, misticismo y 
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dogmatismo. Idénticamente en el caso del status socioeconómico es de esperar que la 
educación se correlacione estrechamente con la ocupación y el ingreso. Sin embargo, 
existen casos en los cuales se producen “inconsistencias”: sujetos con alta educación y 
bajo ingreso; alta ocupación y baja educación, etc.; o en el caso de religiosidad, sujetos 
que responden positivamente a ítems de dogmatismo y negativamente a ítems de 
ritualismo. En el caso de escalas es posible construir escalas multidimensionales o 
escalas unidimensionales. 


3) La tercera digresión es parte ya del discurso propio de la construcción de escalas para 
la medición de actitudes y tiene que ver con los modos en que se incluyen o eliminan los 
ítems de una escala. Una vez que los ítems o los juicios de actitud han sido formulados o 
recolectados, los métodos utilizados para su inclusión en las escalas son: 

a) Uso de jueces que no responden a los ítems en términos del grado de acuerdo o 
desacuerdo que se tenga con ellos, sino en el grado de validez que el juez otorgue al ítem 
о juicio en relación а la variable. Es decir que los jueces son utilizados aquí para 
determinar el valor que el investigador va a asignar al ítem sobre un continuo 
psicológico. Una vez que los juicios o ítems tienen asignado un valor, se aplican a los 
sujetos para que ellos sí expresen su grado de acuerdo o desacuerdo. Los puntajes 
definitivos serán computados a partir del valor dado por los jueces. Las escalas que 
desarrollaremos más adelante y que utilizan este sistema son: la del método de intervalos 
aparentemente iguales de Thurstone, la de intervalos sucesivos y la de comparación por 
pares. 

b) El método de las respuestas directas con los ítems o juicios. Este método no 
requiere el conocimiento previo de los valores de escala, sino que los puntajes se 
determinan en función de las respuestas. No es necesaria la utilización de jueces en el 
sentido expresado en el parágrafo anterior. El método a examinar aquí será el del análisis 
de escalograma y el de la escala Lickert. 

с) Finalmente, en la combinación de método de respuesta y de uso de jueces, el 
método a examinar será el de la técnica de la escala discriminatoria (scale-discrimination 
technique). 


4) La cuarta digresión tiene que ver con los problemas de confiabilidad y validez, y con 
que los resultados en el test pueden sufrir variaciones de tres tipos: 

a) Variaciones en el instrumento: los errores producto de instrumentos “mal 
calibrados” (problema de validez). 

b) Variaciones en los sujetos: dicho en otros términos, en dos aplicaciones distintas en 
el tiempo, el sujeto produce resultados distintos (problemas de confiabilidad). 

c) Variaciones simultáneas en los sujetos y en el instrumento: por instrumento 
“válido” entendemos aquel que mide efectivamente lo que se propone medir; mientras 
que por “confiable” entendemos que mide siempre de la misma manera. 


3) La quinta digresión se relaciona estrechamente con la tercera y la cuarta, y se refiere a 
las formas en que sean clasificadas las escalas según estén centradas en los sujetos, en el 
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instrumento о en ambos: 

a) El enfoque centrado en el instrumento, llamado stimulus-centered approach 
(Torgerson), es aquel en el cual la variación sistemática en la reacción de los sujetos al 
estímulo es atribuida a diferencias en éste. 

b) En el enfoque centrado en el sujeto (subject-centered approach) la variación al 
estímulo es atribuida a diferencias individuales en los sujetos. 

c) En el enfoque centrado en la respuesta (response approach) la variabilidad de 
reacciones al estímulo se atribuye tanto a las reacciones de los sujetos como al 
instrumento. 


6) Otra forma de clasificar los instrumentos o escalas es la propuesta por Coombs,' de 
tests de Tipo A y tests de Tipo B: 

a) El test de tipo A: sirve para determinar algunas propiedades de un sujeto o de un 
objeto en el medio de una persona. A través de su conducta en la situación de prueba (es 
decir, su rendimiento en un ítem específico de la escala) el sujeto, consciente o 
inconscientemente, se sitúa en una posición a lo largo del continuo en la variable que la 
escala está midiendo. Gráficamente: 


Estímulo [] —————>>0 Persona puesta a prueba 


Variable РА 


Б) El test de tipo В: se usa para determinar las propiedades de un objeto. El sujeto 
indicaría entonces la posición de uno o más objetos (ítems en nuestro caso) a lo largo de 
la variable. En la construcción de escalas, el test de tipo B se utiliza por ejemplo cuando 
se pide a jueces que ubiquen el valor que un determinado ítem tiene en cierta variable 
(ver escala Thurstone). La situación gráfica es la siguiente: 


Sujeto O 
Objeto 2 V У Objeto 1 
Valores de Objeto2 V. Y Objeto 1 
escala 0 1 2 3 4 5 6 7 8 9 10 11 


Ejemplo: Si usted le pregunta a un número de personas cuál es el partido político que 
tiene el programa más conservador en Argentina, el ítem o pregunta puede ubicarse 
como un test de tipo B. Si la pregunta fuera: ¿Cuál es el partido con el que usted más 
simpatiza?, se trataría de un test de tipo A. 


7) La última digresión tiene que ver con los ítems. Por ahora podemos definir el ítem 
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como una frase o juicio indicador de la variable que estamos tratando de medir. La 
formulación del ítem en el caso en que estemos trabajando con cuestionarios es siempre 
un juicio, nunca una pregunta o una interrogación. Para relacionar los ítems con los 
niveles de medición mencionados en la primera digresión tomemos los siguientes 
ejemplos: 


A) ¿Entre cuáles de los siguientes grupos de altura se ubica usted? (marque con 
una cruz la que corresponda) 


Г] 120-139 cm 
O 140-159 cm 
Г] 160.179 cm 
O 180-199 cm 
Г] 200-219 cm 


В) Si usted tuviera que definir sus intereses en los asuntos políticos, ¿diría que está 
muy interesado, algo interesado, ni desinteresado ni interesado, desinteresado o muy 
desinteresado? 


O Muy interesado 
[7 Interesado 

O Indiferente 

C Desinteresado 

O Muy desinteresado 


C) De los siguientes, ¿cuál es el diario que lee con mayor frecuencia? 
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O Excelsior 

Г] Novedades 

Г] Últimas Noticias 
O El Heraldo 

O El Día 

O El Sol de México 
O Ovaciones 

O La Prensa 


Г ¡dimos Pepe ss rs 


El ejemplo A señala una variable medida a nivel racional; 
el ejemplo B corresponde a un nivel de medición ordinal y 
el ejemplo C corresponde a un nivel de medición nominal. 


Ahora bien, si tratamos de medir la altura de una persona, como en el caso del 
ejemplo A, es evidente que podemos hacer la medición de varias maneras. Por un lado 
podríamos tener diferentes varas con diferentes alturas: una vara de 175, otra de 176, 
otra de 177, etc. Supongamos que nos llega un sujeto de 178 cms de altura; le aplicamos 
la vara de 160; la rechazamos diciendo que el sujeto es más alto, y seguimos aplicando 
varas hasta que llegamos a la correcta. En este caso estamos tratando con lo que se 
denomina ítems acumulativos, que en el cuestionario autoadministrado aparecerían de la 
siguiente forma: (las marcas aparecen para el caso de nuestro sujeto que mide 178 cm) 
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Ítem 1: ¿Tiene Ud. más de 170 cm de altura? Sí E No O 
Ítem 2: ¿Tiene Ud. más de 171 cm de altura? Sí No Y 
Ítem 3: ¿Tienc Ud. más de 172 ст de altura? Si [Ж] No [1 
Ítem +: ¿Viene Ud. más de 173 cm de altura? Si № О 
Ítem 5: ¿Tiene Ud. más de 174 cm de altura? . sig Nog 
Ítem 6: ¿Tiene Ud. más de 175 cm de altura? Sí R] No O 
Ítem 7: ¿Tiene Ud. más де 176 cm de altura? Sí E] No О 
Ítem 8: ¿Tiene Ud. más de 177 cm de altura? Sí No О 
Пет 9: ¿Tiene Ud. más de 178 cm de altura? si O No 
item 10: ¿Ticne Ud. más de 179 cm de altura? si O No K 
Ítem 11: ¿Tiene Ud. más дс 180 cm de altura? SO Мор 
Etcétera. Etc. 


Si una persona ha contestado a una de las preguntas con un “Sí”, sabemos que todas 
las preguntas que están por “arriba” tienen también, por derivación, una respuesta “Sí”. 
De la misma manera, si una persona ha respondido “No”, todas las preguntas que estén 
por “debajo” tendrán una respuesta similar. 


Una alternativa diferente de presentar la pregunta es a través de ítems diferenciados? 
en la que, ante una serie de ítems, la persona entrevistada marcará solo una o algunas 
alternativas. En un cuestionario, la pregunta sería realizada de la siguiente manera: 


ítem 1: ¿Está Ud. entre los 170-174 cm de altura? Si (бә 
ítem 2: ¿Está Ud. entre los 175-179 em de altura? 9 М№о 
Ítem 3: ¿Está Ud. entre los 180-184 cm de altura? Si 
Ítem 4: ¿Está Ud. entre los 185-190 cm de altura? Sí 


Un ítem incluido en una serie de ítems diferenciados debe ser formulado de manera 
tal que sea respondido con un “Sí” únicamente por las personas que tienen una posición 
fija a lo largo de la variable. Un ítem incluido en una serie de ítems acumulativos debe 
ser formulado de manera tal que solamente pueda ser respondido con un “Sí” a un lado 
de una determinada posición a lo largo de la variable investigada. 

Trabajando con la altura de las personas, la diferencia entre estos dos tipos de serie de 
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ítems aparece como trivial. Sin embargo, еп el tratamiento de las escalas para medición 
de actitudes, su diferenciación es importante. Consecuentemente, en cada tipo de las 
escalas a examinar (Lickert, Thurstone, Guttman, comparación por pares) tomaremos en 
cuenta la especificación de esta perspectiva. 


ESCALAS PARA LA MEDICIÓN DE ACTITUDES 
Vamos a utilizar la definición de escalas hecha por Stoufer:? 


Se dice que existe escala cuando a partir de una distribución de frecuencias 
multivariada de un universo de atributos es posible derivar una variable cuantitativa 
con la cual caracterizar los objetos de un modo tal que cada atributo sea una función 
simple de aquella variable cuantitativa. 


Una escala es una forma particular de índice, aunque aquí utilizaremos una serie de 
procedimientos objetivos para la selección de ítems destinados a controlar los errores 
producto de la subjetividad del investigador. (Ver el capítulo sobre “Conceptos, 
indicadores e índices”.) Construir una escala implica una serie de procedimientos 
mediante los cuales —de acuerdo a distintas reglas— se seleccionan ítems y se 
adjudican números a un conjunto de ítems (juicios о sentencias), número que va a 
expresar la intensidad que un sujeto o grupo de sujetos manifiestan en la variable. 

Las actitudes en el contexto individual representan un estado mental que es un puente 


entre estados psicológicos y objetos exteriores. Kretch y Cruschfield 4 sostienen a este 
respecto que se puede definir una actitud “como una organización durable de procesos 
motivacionales, emocionales, perceptuales y cognitivos con respecto a algún aspecto del 
mundo del individuo”. Las actitudes serían entonces procesos claves para entender las 
tendencias del individuo en relación con objetos y valores del mundo externo, aunque 
esas tendencias no son estáticas y, como las de Newcomb. las actitudes representan un 
residuo de la experiencia anterior del sujeto. Las actitudes perdurarían en el sentido en 
que tales residuos “son trasladados a nuevas situaciones, pero cambian en la medida en 
que nuevos residuos son adquiridos a través de experiencias en situaciones nuevas”. 

Las actitudes serían entonces tendencias a actuar con respecto a alguna entidad 
especificable (Newcomb); o como quieren Thomas y Znaniecki: е 
individual a reaccionar, positiva o negativamente, a un valor social dado”. 

Las actitudes medidas por escalas deben interpretarse en términos analíticos no como 
“hechos”, sino como “síntomas”. Existe una serie de conceptos relacionados con las 
actitudes; entre ellos detallamos los siguientes: 

Creencia: actitudes que incorporan una cantidad importante de estructuración 
cognitiva. Las actitudes son hacia algo, mientras que las creencias son en o sobre algo. 

Sesgo (bias): son actitudes o prejuicios débiles, basados en premisas incompletas, 
deducidas falsamente o preconcebidas. Por lo tanto son poco precisas y relativamente 
fáciles de cambiar. 


“la tendencia 
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Doctrina: son objetos estímulos elaborados, hacia los cuales el individuo manifiesta 
una actitud. Una doctrina (republicana, liberal, católica, comunista, etc.) describe 
específicamente las razones para adherencia; por lo tanto una doctrina se aprende. 

Fe: implica una actitud con alta carga emocional o afectiva. El sistema de actitudes 
referentes a la fe describe una creencia fundamental y específica de la persona. La fe se 
ubica entre la creencia y la ideología. 

Ideología: es un sistema cognitivo elaborado, que sirve para justificación de formas 
específicas de comportamiento, o como medio de racionalización. La ideología es 
concebida como un sistema lógico falso. La ideología se acepta como una fe. 

Valor: en un sentido psicológico amplio, valores son marcos de referencia que sirven 
de guía o mapa para la evaluación de la experiencia y la conducta. Sistema de valores 
sería la organización elaborada y articulada de actitudes, que toman valencias positivas, 
negativas o neutras en cuanto a objetos, estímulos del ambiente y la relación de éstos con 
las metas de vida. 

Opinión: son evaluaciones tentativas, no fijas, sujetas a cambio o inversión. Es decir, 
son menos fijas y no comprometedoras para el individuo. 


ACTITUDES E INTERESES: ALGO ACERCA DE SU DIRECCIÓN E INTENSIDAD 


Señalamos brevemente aquí algunas propiedades de las actitudes que tienen que ver con 
los problemas asociados a la medición de las mismas a través de escalas. 

1) Dirección. La actitud puede ser positiva o negativa. En algunos casos es explicable 
hablar de una actitud neutral cuando el sujeto no es ni positivo ni negativo hacia el 
objeto. 

2) Intensidad. La intensidad de la actitud es alta si el sujeto está fuertemente 
convencido de que la actitud es justificada y baja si el sujeto no piensa así. Al respecto, 
una medida aceptable es la frecuencia con la cual el sujeto usa fuertes expresiones que 
señalan un engrane emocional y en la medida en que él está preparado a argumentar en 
favor de su posición. 

3) Estabilidad. La actitud es estable si permanece invariable por un periodo muy 
largo. 

4) Fortaleza. Una actitud es fuerte si, por ejemplo, es difícil de cambiar a través de 
persuasión o propaganda, y suave si cambia fácilmente. 

3) Importancia. La importancia de la actitud es grande si influye sobre la conducta de 
una persona en muchos campos de actividades. 

6) Visibilidad, observabilidad o relevancia externa. Ésta es alta si es fácil concluir a 
partir de observaciones sobre la conducta del sujeto (manera de hablar, acciones) que él 
tiene cierta actitud. 

7) Relevancia interna. Es detectable si en la experiencia del sujeto la actitud por sí 
misma tiene una parte importante en su mundo de referencia. La actitud de una persona 
hacia la religión puede tener baja relevancia externa y, al mismo tiempo, una alta 
relevancia interna. 
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8) Involucramiento del ego. Cuando una actitud llega a constituir una parte 
importante de la personalidad, o es algo adherido a ella. 

9) Integración y aislamiento. De un sistema mayor de actitudes interrelacionadas 
(perspectiva de vida, ideologías) Las actitudes políticas о religiosas están 
frecuentemente incluidas en tal sistema complejo, mientras que una actitud hacia una 
cierta pasta de dientes es experimentada como aislada, sin relación lógica o psicológica 
con el complejo sistema total. 

10) Especificidad o precisión. La imaginación es dirigida hacia la actitud. Ejemplo: 
un profesor de teología tiene una actitud más específica hacia la Iglesia católica que el 
“hombre de la calle”. 

11) Verificabilidad. La imaginación es igualmente dirigida hacia la actitud. El 
conocimiento es verificable, la fe, no; las opiniones ocupan un lugar intermedio y 
pueden a veces ser verificadas. 

Debe notarse que muchas de las propiedades de las actitudes están correlacionadas. 
Alta intensidad frecuentemente significa estabilidad, fortaleza, alta relevancia interna y 
externa y alto grado de involucramiento del ego. Es importante observar los casos en los 
cuales las propiedades no están combinadas. En dichos casos, las distinciones hechas 
anteriormente son obvias. 

Las pruebas ordinarias de actitud sólo admiten la medición de algunas de las 
propiedades mencionadas, principalmente dirección e intensidad. Para determinar las 
otras propiedades de la actitud podría ser útil una entrevista profunda del tipo entrevista 
focalizada. 

Dirección e intensidad frecuentemente son vistas como una sola propiedad de la 
actitud. Este enfoque es justificado por lo siguiente: suponiendo que dirección e 
intensidad son dos variables independientes, si de cada una de ellas pueden obtenerse 
tres valores diferentes, las combinaciones siguientes son posibles: 


Ni fuerte mi débil 


СплАлрко 1 


Débil 


Una serie de investigaciones (entre otras la realizada por Edward H. Suchman) han 
mostrado, sin embargo, que una actitud neutral demuestra una baja intensidad. En la 
mayoría de los casos, las dos áreas rayadas podrían ser consideradas como inexistentes. 

Los resultados son siete combinaciones, las cuales pueden ser ordenadas de la 
siguiente manera: 
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жей нук ИЛЭ MA 
Fuerte Neutral Fuerte 
positivo negativo 


Esta perspectiva ha sido también usada en la construcción de un significativo “punto 
cero” para las escalas de actitudes. El cuadro 2 resume las semejanzas y diferencias entre 
tres de las principales escalas y el tipo de enfoque utilizado en ellas. En la parte final del 
capítulo agregamos el método de comparación por pares, de diferencial semántico y de 
escala de distancia social de Bogardus. 


LA ESCALA LICKERT 


Es un tipo de escala aditiva que corresponde a un nivel de medición ordinal, consistente 
en una serie de ítems o juicios ante los cuales se solicita la reacción del sujeto. El 
estímulo (ítem o sentencia) que se presenta al sujeto representa la propiedad que el 
investigador está interesado en medir y las respuestas son solicitadas en términos de 
grados de acuerdo o desacuerdo que el sujeto tenga con la sentencia en particular. 
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Cuabro 2. Semejanzas y diferencias entre algunos tipos de escalas para la medición de actitudes у en los enfoques 
Centrado en el sujeto, Centrado en el estimulo y Response-approach 


Semejanzas 


Los tres tipos de enfoques se 
usan en la construcción de 
escalas que permiten medir 
distinciones de grado, más 
que de cualidad entre in- 
dividuos 


Semejanzas en las escalas Lic- 
kert-T hurstone-Guttman 


Con pequeñas modificaciones 
los mismos items pueden 
utilizarlos en los diferentes 
tipos de escala, ya que la 


diferencia entre las escalas 
no reside en la elección de 
los items, sino en la rela- 
ción lógica existente entre 
ellos 


Las tres emplean el método 
de jueces en la construc- 
ción de la escala 


Estrictamente todas las esca- 
las miden a nivel ordinal 


En principio las tres son uni- 
dimensionales 


En el momento de aplicar la 
escala ya validada (versión 
final), aunque se hayan uti- 
lizado distintos enfoques en 
la construcción, todos los 
procedimientos уап a estar 
centrados en el sujeto. Lo 
que subyace en todos los 
procedimientos es obte- 
ner conocimientos de las 
actitudes que forman parte 
de un contexto sociocul- 
tural 


DIFERENCIAS 


Centrado en el sujeto 


Consiste en preguntarle a un 
sujeto su opinión acerca de 
un objeto para que él se 
ubique en determinado 
punto de la escala 


Se dan valores a los sujetos 


Se subrayan las diferencias 
individuales 


Análisis de la varianza uni- 
direccional 


Ejemplo: escala Lickert 


Escala ordinal 


Escala aditiva 


Pretende ser unidimensional, 
pero de hecho se mezclan 
dimensiones 


Los ítems se elaboran unidi- 
reccionalmente, procurando 
un 509% de items positivos 
y un 50% de items nega- 
tivos 


Los items son acumulativos, 
por ello pueden estar apro- 
ximadamente en la misma 
posición de la escala 


La cantidad de ítems en la 
versión de los jueces varía 
de 30 a 50, En la versión 
final quedan entre 15 y 25 


La selección de los ítems se 
realiza en base a su poder 
discriminativo 


Las alternativas de respuesta 
en cada ítem pueden variar 
de 3, 4, 5 o más alterna- 
tivas 


No existe gradación de los 
ítems a lo largo de un con- 
tinuo 


Centrado en el estímulo 


Consiste en preguntarle dón- 
de ubicaría un estímulo so- 
bre un continuo que repre- 
senta el objeto de estudio 


Se dan valores a los estímulos 


Se tratan de eliminar las di- 
ferencias individuales 


Análisis de la varianza unidi- 
reccional 


Ejemplo: escala Thurstone 


Pretende ser intervalar 


Escala diferencial 


Idem. a la Lickert 


Los ítems se formulan de ma- 
nera que á sean positivos; 
% negativos y & neutros 


Los items son diferenciadores 


El número de ítems iniciales 
puede llegar a los 200. En 
la escala final pueden que- 
dar un máximo de 50 


La selección de los ítems se 
hace en base al recorrido 
intercuartílico 


El puntaje de los ítems se de- 
termina por el valor de la 
mediana de los puntajes 
asignados por jueces, sobre 


una escala que va de 1а 11 


Se presentan mezclados items 
positivos, negativos y neu- 
tros 
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Response-approach 


El propósito puede ser esca- 
lar los sujetos, los estímu- 
los, o ambos en relación a 
un objeto 


Se dan valores tanto a los su» 
jetos como a los estímulos 


Se tienen en cuenta las dife- 
rencias en los sujetos y en 
los individuos 


Análisis de la varianza en dos 
direcciones 


Ejemplo: escala Guttman 


Escala ordinaria 


Escala acumulativa 


Es unidimensional, ésta es de- 
terminada por el coeficiente 
de reproductividad 


Como es una técnica de aná- 
lisis, los ítems se formulan 
de acuerdo a la técnica que 
se decida utilizar, Lickert 
о Thurstone 


Cada ítem tiene el carácter 
de acumulativo 


La cantidad de ítem depende 
de la técnica de construc- 
ción 


La selección de los items se 
basa en su escalabilidad, 
que se determina en base 
al número de errores 


El puntaje de los ítems varía 
de acuerdo a la técnica em- 
pleada 


Los ítems se ordenan en for- 
ma decreciente de acuerdo 
a su grado de dificultad 


Semejanzas 


Солрко 3 


Centrado en el sujeto 


El número de jueces yaría de 
50 a 100. Éstos deben tener 
características similares a 
las de los sujetos en el uni- 
verso a estudiar 

La consistencia interna de la 
escala se establece mediante 
el método de correlación 
por mitades (split-half) 


A cantidad igual de items es 
más confiable que la escala 
Thurstone. La confiabili- 
dad aumenta con el incre- 
mento en las alternativas 
de respuesta 


Es más fácil y rápida de cons- 
truir 


Escala correspondiente a test 
de Tipo A 


En la escala final se presen- 
tan los items con la canti- 
dad de alternativa idéntica 
a la de la versión de los 
jueces 

El puntaje máximo es igual 
al número de ítems multi- 
plicado por el puntaje ma- 
yor en cada alternativa de 
respuesta: el puntaje míni- 
mo es igual al número de 
ítems multiplicado por el 
puntaje menor en las alter- 
nativas de respuesta. Para 
la ubicación de individuos 
se pueden utilizar también 
en valores promedio 


Con frecuencia la puntuación 
total de un individuo pue- 
de tener un significado 
poco claro, cuando se 
compara con otros indivi- 
duos, ya que combinaciones 
distintas pueden producir 
el mismo resultado 


El problema principal de la 
escala es la validez. Deter- 
minar cuándo una misma 
puntuación alcanzada por 
combinación de distintas ca- 
tegorías de respuesta tiene 
consecuencias para la іп- 
terpretación del atributo en 
cuestión y cuándo no 


DIFERENCIAS 


Centrado en el estímulo 


El número de jueces es entre 
50 y 200. Se exige de ellos 
objetividad e información 


La consistencia interna se 
basa en el cálculo de la 
correlación entre cada ítem 
con el puntaje total del 
test (item-test) 


Cuando se alcanza un núme- 
ro de 50 items es más con- 
fiable que la Lickert 


Difícil de construir. Gasto 
fuerte en términos de tiem- 
po y trabajo 

Corresponde a un test de 
Tipo B 


En la escala final se presen- 
tan solamente dos alterna- 
tivas de respuesta: acuerdo- 
desacuerdo 


El puntaje máximo y mini- 
mo en la escala se determi- 
nan por la sumatoria de 
items ponderados 


Idem. a la Lickert 


El problema principal es el 
centro de la escala. Éste no 
nos dice mucho acerca del 
significado que tiene el he- 
cho de que un individuo 
ocupe una posición en el 
centro de la escala 


Response-approach 


El número de jueces depende 
de la técnica empleada en 
la construcción 


La consistencia interna está 
determinada por la escala- 
bilidad, calculada en base 
a la diferencia CR-MMR 


Es más confiable debido a 
su unidimensionalidad 


Depende de la técnica utili- 
zada en la construcción 


Corresponde a ambos tipos 
de test (A y B) 


En la escala final se presen- 
tan los ítems en orden de 
dificultad creciente 


Los sujetos se ubican en la 
escala en forma decrecien- 
te: desde los que contesta- 
ron en forma positiva a 
todas las preguntas hasta 
los que contestaron en for- 
ma negativa a todas las 
preguntas 


Los individuos que tienen 
un puntaje de actitud más 
favorable, deben también 
tener una actitud más fa- 
vorable en cada ítem esca- 
lado 


En el caso de actitudes com- 
plejas, no es muy eficaz 


El método del summated ratings de Lickert resulta de la suma algebraica de las 
respuestas de individuos a ítems seleccionados previamente como válidos y confiables. 
Si bien la escala es aditiva, no se trata de encontrar ítems que se distribuyan 
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uniformemente sobre un continuo “favorable-desfavorable”, sino que el método de 
selección y construcción de la escala apunta a la utilización de ítems que son 
definitivamente favorables o desfavorables con relación al objeto de estudio. El puntaje 
final del sujeto es interpretado como su posición en una escala de actitudes que expresa 
un continuo con respecto al objeto de estudio. 

La escala Lickert es pues un test de Tipo A, ya que el sujeto, a través de su conducta 
en la situación de prueba, consciente o inconscientemente, se sitúa a lo largo de la 
variable. La escala Lickert es también una escala del tipo centrada en el sujeto (subject- 
centered): el supuesto subyacente es que la variación en las respuestas será debida a 
diferencias individuales en los sujetos. Veremos además, cuando examinemos los pasos 
en la construcción de la escala, que la escala inicial se administra a una muestra de 
sujetos que actuarán como jueces. (Esa muestra de sujetos debe ser representativa de la 
población a la que se aplicará la escala final.) 

Finalmente, los ítems son seleccionados en base a su poder discriminatorio entre 
grupos con valores altos y con valores bajos en la variable. Es decir que lo que interesa 
es la coherencia, entendida en función de las respuestas. 


A) La construcción de una escala Lickert 


La construcción de una escala de este tipo implica los siguientes pasos: /) Es necesario 
construir una serie de ítems relevantes a la actitud que se quiere medir. 2) Los ítems 
deben ser administrados a una muestra de sujetos que van a actuar como jueces. 3) Se 
asignan puntajes a los ítems según la dirección positiva o negativa del ítem. 4) Se 
asignan los puntajes totales a los sujetos de acuerdo al tipo de respuesta en cada ítem, la 
suma es algebraica. 5) Se efectúa un análisis de ítems. 6) Se construye con base en los 
ítems seleccionados la escala final. Examinemos en detalle cada uno de los pasos: 


1) La construcción de los items 


Los ítems que van a aplicarse a la muestra inicial de jueces, cuyo número debe ser entre 
30 y 50. Para la construcción de los ítems deben tomarse en cuenta los siguientes 
criterios, que aparecen en Edwards: 7 

a) Evite los ítems que apuntan al pasado en lugar del presente. 

b) Evite los ítems que dan demasiada información sobre hechos, o aquellos que 
pueden ser interpretados como tales. 

с) Evite los ítems ambiguos. 

а) Evite los ítems irrelevantes con respecto a la actitud que quiere medir. 

e) Los ítems en la escala deben formularse según expresen actitudes o juicios 
favorables o desfavorables con respecto a la actitud. No se trata de elegir ítems que 
expresen distintos puntos en el continuo. 

$) Evite los ítems con los cuales todos o prácticamente nadie concuerda. 

g) Los ítems deben ser formulados en lenguaje simple, claro y directo. 
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А) Solamente en casos excepcionales exceda de las 20 palabras cuando formule el 
Кет. 

i) Un Пет debe contener sólo una frase lógica. 

j) Los ítems que incluyan palabras como “todos 
omitirse. 

k) De ser posible, los ítems deben ser formulados con frases simples, y no 
compuestas. 

1) Use palabras que el entrevistado pueda comprender. 

m) Evite las negaciones, particularmente las dobles negaciones. 

n) Combine los ítems formulados positiva y negativamente en una proporción 
aproximada a 50% — 50%. 

Un sistema que puede ser aplicado para eliminar muchos ítems dudosos o que dan 
demasiados hechos es el siguiente: cada miembro del grupo de investigación responde a 
los ítems asumiendo primero una actitud positiva hacia la variable y luego responde 
como si tuviese una actitud negativa. Si la respuesta en ambos casos se ubica en la 
misma categoría, el ítem no es apropiado para incluir en la versión de los jueces. 

Cada ítem es entonces un juicio o una sentencia a la cual el juez debe expresar su 
grado de acuerdo o desacuerdo. La graduación de acuerdos o desacuerdos varía en 
cantidad de alternativas que se le ofrece al sujeto; éstas pueden ser 3, 4, 5,6 0 7 
alternativas. En general, la decisión sobre la cantidad de alternativas a ofrecer dependerá 
no tanto de las “preferencias personales” del investigador, sino del tipo de investigación, 
del tipo de pregunta, del tipo de distribución de la variable, etc. Ejemplificaremos a 
continuación algunos ítems con sus respectivas alternativas. 


79 сс 


siempre”, “nadie”, etc. deben 


Las siguientes afirmaciones son opiniones con respecto a las cuales algunas personas 
están de acuerdo y otras en desacuerdo. Indique, por favor (marcando con una X en el 
paréntesis correspondiente), la alternativa que más se asemeja a su opinión. 
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) Muy de acuerdo 

) De acuerdo 

Ni acuerdo пі desacuerdo 
En desacuerdo 

Muy en desacuerdo 


1) Las mujeres no deberían meterse еп 
política. 


Muy de acuerdo 

De acuerdo 

En desacuerdo 

Muy en desacuerdo 

Ni acuerdo ni desacuerdo 


2) Leyendo lo que se publica en los dia- 
rios y las informaciones de radio y 
TV, es posible tener una idea acer- 
tada de lo que ocurre en la situación 
política mexicana. 


“¡otalmente de acuerdo 
Medianamente de acuerdo 
Escasamente de acuerdo 
Escasamente en desacuerdo 
Medianamente en desacuerdo 
Totalmente en desacuerdo 


3) Los manifiestos, proclamas y solicitu- 
des que publican en los diarios los 
partidos políticos no informan sobre 
sus verdaderos propósitos. 


Nur? м a? ga? a? a? м gr at a 


Verdadero 
Falso 


4) Vivo intensamente el presente sin pen- ( 
sar en el futuro. ( 


чч 


Los ejemplos expresan ítems positivos y negativos; manifiestos y latentes у con 
distintas alternativas de respuesta. Los ítems son construidos a partir de juicios que 
expresan alguna relación postulada a nivel de la teoría sustantiva, y de observaciones 
empíricas de afirmaciones de grupos o sujetos que pertenecen a grupos o asociaciones 
que manifiestan la propiedad que se quiere medir. Los ítems así pueden ser extraídos de 
libros, publicaciones y artículos que tratan teóricamente sobre el objeto que se quiere 
medir. También puede el investigador acudir a análisis de contenidos sobre discursos o 
manifiestos de individuos y asociaciones (por ejemplo, si se trata de medir radicalismo- 
conservadurismo, una fuente muy rica para la formulación de ítems son las declaraciones 
de grupos de interés: empresarios, grupos políticos de izquierda y de derecha, etc.). Otras 
estrategias para la construcción de ítems aparecen señaladas en la sección 
correspondiente a la escala Thurstone. 


2) La administración de los ítems a una muestra de jueces 


Una vez construidos los ítems (30 a 50) serán distribuidos entre una muestra de jueces 
(de 50 a 100) los cuales deben ser seleccionados al azar de una población con 
características similares a aquella en la cual queremos aplicar la escala final. (Para los 
procedimientos de selección de la muestra ver el capítulo “Muestreo” en este manual.) 
Estos jueces responderán a cada uno de estos ítems según su opinión. Las instrucciones a 
los jueces pueden ser dadas según el siguiente ejemplo: 


EJEMPLO DE UNA VERSIÓN PRELIMINAR 


170 


El presente es un estudio de opiniones de estudiantes universitarios respecto a problemas 
actuales de la universidad. 

A continuación se presenta una serie de afirmaciones respecto de las cuales algunas 
personas están de acuerdo y otras en desacuerdo. Después de cada afirmación se ofrecen 
cinco alternativas de respuestas posibles: 


( ) Totalmente de acuerdo. 

( ) De acuerdo en general. 

( ) Ni de acuerdo ni en desacuerdo. 
( ) En desacuerdo en general. 


( ) Totalmente en desacuerdo. 


Indique, por favor —marcando con una cruz en el paréntesis—, la alternativa que 
más se asemeje a su opinión. Cuando no entienda alguna afirmación, ponga un signo de 
interrogación (?) al frente de ella. Trate de responder lo más rápido posible. Muchas 
gracias. 
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. Las representaciones estudiantiles de- 
berían participar en las decisiones so- 
bre planes de estudio. 


. Las clases en las que el profesor tie- 


ne todo el control son las que mejores 


resultados producen en el aprendi- 
zaje. 


. El plan de estudios de la unam debe 
ser centralizado en la Secretaría de 
Educación Pública. 


. El trabajo en grupo es más producti- 
vo que el trabajo individual. 


. Las carreras a las que el gobierno у 
la Universidad deberían prestarles 
más apoyo son aquellas centradas en 
las necesidades del país. 


. El alumno debe tener libertad en la 
elección de cuál es la mejor manera 
de controlar su rendimiento acadé- 
mico. 


. La única obligación de los alumnos 
es estudiar. Los planes de estudio son 
asunto de los profesores. 


. La mejor manera de juzgar a un es- 
tudiante es por su rendimiento aca- 
démico. 


PS ^— E ^— PS р ^^ 


=ч ^ч o E E PA E р И o — 


PU AAA n ^— E ^— 
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) Totalmente de 
) De acuerdo en 
) Ni de acuerdo 
) En desacuerdo 
) Totalmente en 


) Totalmente de 
) De acuerdo en 
) Ni de acuerdo 
) En desacuerdo 
) Totalmente en 


) Totalmente de 
) De acuerdo en 
) Ni de acuerdo 
) En desacuerdo 
) Totalmente en 


) Totalmente de 
) De acuerdo en 
) Ni de acuerdo 
) En desacuerdo 
) Totalmente en 


) Totalmente de 
) De acuerdo en 
) Ni de acuerdo 
) En desacuerdo 
) Totalmente en 


) Totalmente de 
) De acuerdo en 
) Ni de acuerdo 
) En desacuerdo 
) Totalmente en 


) Totalmente de 
) De acuerdo en 
) Ni de acuerdo 
) En desacuerdo 
) Totalmente en 


) Totalmente de 
) De acuerdo en 
) Ni de acuerdo 
) En desacuerdo 
) Totalmente en 


acuerdo 

general 

ni en desacuerdo 
en general 
desacuerdo 


acuerdo 

general 

ni en desacuerdo 
en general 
desacuerdo 


acuerdo 

general 

ni en desacuerdo 
en general 
desacuerdo 


acuerdo 

general 

ni en desacuerdo 
en general 
desacuerdo 


acuerdo 

general 

ni en desacuerdo 
en general 
desacuerdo 


acuerdo 

general 

ni en desacuerdo 
en general 
desacuerdo 


acuerdo 

general 

ni en desacuerdo 
en general 
desacuerdo 


acuerdo 

general 

ni en desacuerdo 
en general 
desacuerdo 
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16. 


. Un trabajo hecho con consulta (еп 


equipo o individualmente) permite 
una mejor evaluación de los conoci- 
mientos de los alumnos que una prue- 
ba hecha en la clase. 


‚ Es preferible que cada escuela uni- 


versitaria tenga un programa fijo de 
estudios en vez de que, como sucede 
en otros países, el alumno pueda es- 
coger con alguna libertad ciertas ma- 
terias de su agrado. 


. Es preferible que los alumnos по ha- 


gan preguntas o intervenciones du- 
rante la exposición del profesor. 


‚ No conviene que los alumnos inter- 


vengan en la confección de los pro- 
gramas de estudio. 


‚ Las pruebas y exámenes deben limi- 


tarse exclusivamente a evaluar el gra- 
do de conocimiento de los alumnos 
respecto a la materia expuesta duran- 
te las horas de clase. 


‚ Es inconveniente que ocupen plazas 


en la universidad estudiantes que se 
verán impedidos de seguir sus estu- 
dios por falta de medios económicos. 


. Deben tener acceso a la cátedra uni- 


versitaria sólo personalidades cientí- 
ficas de determinada orientación ideo- 
lógica. 


No habría por qué hacer esfuerzos 
en adecuar los horarios de clase para 
la gente que trabaja. O se trabaja o 
se estudia. 
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) Totalmente de 
) De acuerdo en 
) Ni de acuerdo 
) En desacuerdo 
) Totalmente en 


) Totalmente de 
) De acuerdo en 
) Ni de acuerdo 
) En desacuerdo 
) Totalmente en 


) Totalmente de 
) De acuerdo en 
) Ni de acuerdo 
) En desacuerdo 
) Totalmente en 


) Totalmente de 
) De acuerdo en 
) Ni de acuerdo 


acuerdo 

general 

ni en desacuerdo 
en general 
desacuerdo 


acuerdo 

general 

ni en desacuerdo 
en general 
desacuerdo 


acuerdo 

general 

ni en desacuerdo 
en general 
desacuerdo 


acuerdo 


general 
ni en desacuerdo 


) En desacuerdo en general 


) Totalmente en 


) Totalmente de 
) De acuerdo en 
) Ni de acuerdo 
) En desacuerdo 
) Totalmente en 


) Totalmente de 
) De acuerdo en 
) Ni de acuerdo 
) En desacuerdo 
) Totalmente en 


) Totalmente de 
) De acuerdo en 
) Ni de acuerdo 
) En desacuerdo 
) Totalmente en 


) Totalmente de 
) De acuerdo en 
) Ni de acuerdo 
) En desacuerdo 
) Totalmente en 


desacuerdo 


acuerdo 

general 

ni en desacuerdo 
en general 
desacuerdo 


acuerdo 

general 

ni en desacuerdo 
en general 
desacuerdo 


acuerdo 

general 

ni en desacuerdo 
en general 
desacuerdo 


acuerdo 

general 

ni en desacuerdo 
en general 
desacuerdo 


20. 


21. 


22. 


24. 


. No deberían otorgarse becas a alum- 


nos capaces, pero con recursos econó- 
micos suficientes, sino a aquellos de 
escasos recursos, aunque sean menos 
capaces. 


. Sólo a los organismos centrales de di- 


rección de la enseñanza universitaria 
les está dada la facultad de decir a 
qué ramos de la enseñanza han de 
conceder becas de estudios. 


. En el organismo universitario desti- 


nado a la distribución de becas de es- 
tudio entre las distintas facultades no 
deben participar estudiantes. 


Para un mejor aprovechamiento de 
los recursos debe haber un organis- 
mo central que controle la concesión 
de becas de estudios. 


A la hora de tomar un acuerdo im- 
portante sobre las evaluaciones docen- 
tes universitarias, las autoridades de- 
ben hacerlo sin tener en cuenta la 
opinión de los alumnos. 


La universidad debería exigir de los 
egresados una retribución por los es- 
tudios recibidos, estableciendo un im- 
puesto por el ejercicio profesional. 


. No compete a las escuelas universita- 


rias fijar la cantidad de matrículas 
anuales para sus alumnos, sino a un 
organismo superior central. 


La decisión respecto de la selección y 
otorgamiento a los estudiantes de ma- 
terial académico debe ser tomada ex- 
clusivamente por los organismos cen- 
trales de la universidad. 
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) Totalmente de 


acuerdo 


) De acuerdo en general 


) Ni de acuerdo 


ni en desacuerdo 


) En desacuerdo en general 


) Totalmente en 


) Totalmente de 


desacuerdo 


acuerdo 


) De acuerdo en general 


) Ni de acuerdo 


ni en desacuerdo 


) En desacuerdo en general 


) Totalmente en 


) Totalmente de 
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ni en desacuerdo 
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) De acuerdo en general 


) Ni de acuerdo 


ni en desacuerdo 


) En desacuerdo en general 


) Totalmente en 


) Totalmente de 


desacuerdo 


acuerdo 


) De acuerdo en general 


) Ni de acuerdo 


ni en desacuerdo 


) En desacuerdo en general 
) Totalmente en desacuerdo 


25. La ampliación de las carreras univer- ( ) Totalmente de acuerdo 
sitarias existentes debe responder so- ( ) De acuerdo en general 
lamente al número de los postulantes ( ) Ni de acuerdo ni en desacuerdo 
que se presenten en cada escuela. ( ) En desacuerdo en general 
( ) Totalmente en desacuerdo 


) Totalmente de acuerdo 

) De acuerdo en general 

) Ni de acuerdo ni en desacuerdo 
) En desacuerdo en general 

) Totalmente en desacuerdo 


26. En las pruebas y exámenes escritos 
no debe haber personal universitario 
que vigile a los alumnos. 


~ р ^— 


) Totalmente de acuerdo 

) De acuerdo en general 

) Ni de acuerdo ni en desacuerdo 
) En desacuerdo en general 

) Totalmente en desacuerdo 


27. Los servicios de habitación y restau- 
rante brindados por la universidad 
deben ser administrados sin ninguna 
participación del estudiantado. 


«^ч Y e „=< р ^м 


) Totalmente de acuerdo 
) De acuerdo en general 


28. No debería haber un organismo cen- ( 
( 
( ) Ni de acuerdo ni en desacuerdo 
( 
( 


tral de planificación universitaria. 


) En desacuerdo en general 
) Totalmente en desacuerdo 


29. Los alumnos no deben tener injeren- ( ) Totalmente de acuerdo 
cia alguna en la labor del personal ( ) De acuerdo en general 
docente. ( ) Ni de acuerdo ni en desacuerdo 
( ) En desacuerdo en general 
( ) Totalmente en desacuerdo 


3) Asignación de puntajes а los items 


Con este paso comienza efectivamente el análisis de la escala. Hay que clasificar a cada 
ítem según sea positivo o negativo, у luego ponderar las alternativas de respuesta. 
Nuevamente existen diferentes criterios para la adjudicación de las ponderaciones. Por 
ejemplo, los pesos para un ítem positivo pueden ser: 


Pesos 
4 ( ) Totalmente de acuerdo 
3 ( ) De acuerdo en general 
2 ( ) Ni de acuerdo пі en desacuerdo 
1 ( ) En desacuerdo en general 
0 ( ) Totalmente en desacuerdo 
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о la alternativa: 


(  ) Totalmente de acuerdo 
( ) De acuerdo en general 
O ( ) Ni de acuerdo ni en desacuerdo 
( ) En desacuerdo en general 
( ) Totalmente en desacuerdo 
o cualquier otra serie de números. 

Por lo general, desaconsejamos la utilización de signos positivos y negativos en la 
adjudicación de los puntajes o de pesos a las alternativas de respuestas, ya que pueden 
crear la falsa impresión, que la escala está midiendo a nivel intervalar; esto es, donde 
tendríamos puntajes finales en los que existe una posición 0, posiciones +1, +2..., +40; y 
posiciones —1, —2, —3..., —40. De hecho la escala mide a nivel ordinal y los valores de 
escala simplemente implican posiciones de rango. 

Para los ítems negativos, hay que recordar que la serie de números a adjudicar debe 
ser inversa. Por ejemplo, en un ítem negativo, la ponderación siguiendo la primera 
alternativa se haría: 


Pesos 
O ( ) Totalmente de acuerdo 
1 ( ) De acuerdo en general 
2 ( ) Ni de acuerdo ni en desacuerdo 
3 ( ) En desacuerdo en general 
4 ( ) Totalmente en desacuerdo 


Los ítems se ubican, ya sea en forma positiva o negativa, en relación a la variable con 
el fin de controlar los efectos del “response-set”, esto es, controlar las pautas de 
respuesta de aquellos respondentes que tienden a dar respuestas afirmativas o negativas 
de manera automática. 


4) Asignación de puntajes totales 


Este paso consiste simplemente en la adjudicación de los puntajes totales para cada 
individuo en la muestra de jueces. Esta suma resulta de la adición de los puntajes 
ponderados para cada ítem. En el caso de ítems con valores negativos, la suma es 
algebraica. 

De comienzo estamos asumiendo que las personas con alto grado en la variable van a 
tener puntajes altos, mientras que las personas con una baja actitud manifestarán 
puntajes bajos. Si hemos presentado 30 ítems con un valor ponderado máximo de 4, y un 
mínimo de cero, la amplitud total de la dispersión de la variable a esperar sería entonces 
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120 (puntajes máximos de 120 y mínimo de 0, respectivamente). 


3) Análisis de los items 


Una vez computados los puntajes totales para todos los jueces, hay que ordenarlos de 
manera que el sujeto con el puntaje total más alto ocupe el primer lugar, el segundo 
puntaje más elevado a continuación, etc., hasta llegar a la persona con el puntaje más 
bajo. 

Una vez ordenados los sujetos, vamos a operar únicamente con los cuartiles 
superiores e inferiores, es decir, el 25% de los sujetos con puntajes más elevados y el 
25% de los sujetos con puntajes más bajos. Del 50% del centro no nos vamos a 
preocupar más. Formamos de esta manera un grupo alto y un grupo bajo con respecto a 
la variable y a los puntajes totales. Si tuviéramos 52 jueces, el grupo alto estará 
constituido por los 13 jueces con los puntajes más elevados y el grupo bajo por los 13 
con puntajes más bajos. 

Tomamos a estos 26 sujetos y los colocamos en una tabla en donde situamos las 
puntuaciones en cada ítem y el puntaje total para cada uno de los sujetos ordenados. 

Hay que seleccionar ahora los ítems que discriminen mejor. Hay tres técnicas más en 
uso para la selección de los ítems: la del cálculo del poder discriminatorio de cada ítem; 
la de correlación ítem-test, y el test de la mediana. 

El procedimiento para el cálculo del poder discriminatorio de un ítem, sigue la forma 
mencionada en el cuadro 3. Una vez separados el grupo alto y el grupo bajo, se calculan 
los promedios de cada ítem en cada uno de los grupos. Siguiendo el ejemplo de la figura 
1, el promedio del ítem 1 es de 3.7 para el grupo alto (resultado de 48/13); y de 0.9 para 
el grupo bajo (resultado de 12/13). 

Una vez calculados los valores promedios para cada ítem en los grupos alto y bajo, 
procedemos a calcular el poder discriminativo de cada ítem según la fórmula: 


DM 


Donde: 


t= Test t de Student 
DM = Diferencia entre medidas (М, — М,) 
$? = yariancias de muestra 1 y 2 respectivamente 
N = cantidad de casos en cada una de las muestras 


Para el cálculo del poder discriminativo del ítem conviene utilizar el siguiente cuadro, 
que es una continuación del cuadro 3: 
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Valores promedios para los grupos alto y bajo y diferencia de medias, 


para el cálculo del poder discriminatorio de items en la versión de los 


jueces en una escala Lickert. 


CUADRO 4. 


[2 [3 |.|: 67 


Diferencia de medias 
(M 1 M.) 


е 
1 


п el grupo 
) 3.7 


Promedio 
alto (M 


o 

E 
© 

o 

$3 
e“ 
ye 

5-5 
a 


Una vez calculados los valores £, confrontamos con la tabla de distribución de valores 
correspondientes, seleccionando aquellos ítems que realmente presenten diferencias 


significativas entre ambos grupos de contraste. 


En los ejemplos señalados en la figura 1, la diferencia para el ítem 1 es significativa al 


El ítem 5 debe ser desechado porque no 


discrimina significativamente. Es importante notar asimismo que en el caso del ítem 7 


nivel de 0.1 y la del ítem 7 al nivel de 0.5. 
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hemos colocado el signo del ítem originalmente mal ya que, como vemos, el grupo con 
valores bajos responde al estímulo en forma más positiva que los del grupo alto. 
Corresponde entonces cambiar los valores, manteniendo el ítem. 

El método item-test para la selección de los ítems consiste en correlacionar el puntaje 
del ítem con el puntaje total del test. El coeficiente de correlación a utilizar es el 
coeficiente de correlación biserial, ya que aquí se trata de dos variables, una que 
podemos considerar intervalar, y la otra una serie dicotomizada, siendo además la 
dicotomía forzada. El supuesto que tenemos que aceptar es que la distribución original es 
continua y normal. La fórmula para el cálculo de la correlación será: 


а _M,-My Р `9 
а ышы ш 


Donde: 


М.у M¿= Medias parciales en el grupo alto y bajo, respectivamente. 
ot = Desviación estándar total. 
р y q = Proporción de casos en una y otra distribución. 
у = Ordenada a la curva normal. 


Cualquiera que sea la técnica utilizada para el análisis de los ítems, el objetivo es 
seleccionar aquellos que discriminen mejor (valores significativos de £, o valores altos de 
rp). 

De hecho hay una alternativa al uso de la prueba /, o del coeficiente de correlación 
biserial, que estrictamente se corresponde más con el tipo de medición de nivel ordinal, 
con el que opera la escala Lickert. En este caso la diferencia entre medianas, computada 
a través del “test de la mediana”. Para ello hay que determinar, primero, el valor de la 
mediana de cada ítem para los grupos alto y bajo combinados, luego dicotomizamos los 
valores en una tabla de 2 х 2 para cada ítem, de la siguiente forma 


Grupo alto Grupo bajo 


Número de puntajes por debajo A 
de la mediana combinada МАРА 
Número de puntajes рог encima C D C+D 


de la mediana combinada 
A+C B+D 


A esta tabla aplicamos ya sea х? о el test de Fisher, según sea la cantidad de casos 
(por lo menos N = 40 para aplicar х?; con menos casos se recomienda el test de Fisher). 
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La fórmula рага el cómputo de х? para este tipo de figura es: 


N 
N [ар — вс) – 2 


х% = ———— 


(А +В) (G + D) (A +C) (B +D) 


Seleccionamos por supuesto aquellos ítems cuyo х? da diferencias significativas. 
Usando la misma figura, el test de Fisher se computa según la siguiente fórmula: 


_ (4+B)! (C+D)! (4+C)! (B+D)! 
O Р O 


6) La versión final de la escala 


La cantidad de ítems seleccionados de acuerdo a su poder discriminativo constituye la 
escala final por aplicar a sujetos o grupos como versión final. Los puntajes finales por 
adjudicar a los individuos son entonces el producto de la suma de los puntajes obtenidos 
en cada ítem, divididos entre el total de ítems. 


B) Comentarios finales 


Para calcular la confiabilidad de la escala, se puede utilizar la correlación entre mitades 
del test (split-half reliability): se correlacionan la suma de los puntajes en los ítems 
impares con la suma de los puntajes de los ítems pares. Utilizamos p de Spearman, y 
luego la fórmula: 


баш. 
THP 


A continuación presentamos las ventajas y desventajas de la escala Lickert, 
comparada con la Thurstone. 

Ventajas. a) Permite la utilización de ítems que no se encuentran relacionados en 
forma manifiesta con la actitud que se desea estudiar (es decir, se pueden utilizar ítems 
con contenido latente). b) Es más rápida y fácil de construir. c) A mismo número de 
items, es más confiable. d) La cantidad de alternativas de respuesta permite una 
información más precisa de un sujeto en un ítem particular. 

Desventajas. a) Por tratarse de una escala ordinal, no permite apreciar la distancia que 
hay entre pares de sujetos con respecto a la actitud. b) Con frecuencia dos puntajes 
iguales pueden ocultar pautas de respuestas diferentes de los individuos. c) No hay 
garantía de unidimensionalidad, consecuentemente pueden mezclarse distintas 
dimensiones, no estando seguro el investigador de cuál de ellas realmente se trata. 
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LA ESCALA THURSTONE 


Thurstone es quien provee la racionalidad —mediante su ley de juicios comparativos— 
para todo el aparato conceptual en la construcción de escalas para medir actitudes. Esta 
ley sostiene que, para cada estímulo (e) dado, está asociado un proceso modal 
discriminal sobre un continuo psicológico. La distribución de todos estos procesos 
discriminacionales sigue la forma de la distribución normal, en la que todos los procesos 
discriminacionales producidos por el estímulo se distribuyen normalmente alrededor del 
proceso de discriminación modal, con una dispersión discriminal (s;). Dado un conjunto 


n de estímulo, es posible ordenarlos en un continuo psicológico tomando como 
referencia el grado de atributo que ellos poseen. 

A partir de estos principios, Thurstone propone su escala de intervalos aparentemente 
iguales, de tipo diferencial, en la que los ítems son seleccionados por una serie de 
técnicas que permiten escalonarlos de manera tal que expresen el continuo psicológico 
subyacente. La medición trata de establecerse al nivel intervalar. Es decir, una escala en 
la que sea posible afirmar que la distancia que separa a un sujeto que obtuvo una 
puntuación de 8.7 con respecto a otro sujeto que obtuvo 6.3 es igual a la distancia que 
separa a otro par de sujetos que obtuvieron puntuaciones de 3.6 y 1.2, respectivamente, y 
a cualquier distancia que sea igual a 2.4 puntos. (Sin embargo, como veremos más 
adelante, es discutido que la escala mida efectivamente este nivel.) 

El continuo psicológico en la escala de intervalos aparentemente iguales de Thurstone 
se edifica sobre una serie de juicios de actitud distribuidos en una escala de 11 puntos, en 
la que el punto 1 de la escala representa una actitud extrema (favorable o desfavorable), 
el punto 6 representa una actitud neutra (ni favorable ni desfavorable), y el punto, 11 el 
otro extremo (favorable o desfavorable, según el extremo contrario a la actitud asumida 
en 1). 

Los ítems en la escala Thurstone son construidos, diseñados y seleccionados de 
manera tal que permitan atribuir a los sujetos a los que se aplicará definitivamente la 
escala un punto en un continuo. Así, esta escala es un poco más refinada que la escala 
Lickert, e implica una cantidad considerable de trabajo adicional. 


A) La construcción de una escala Thurstone 


Los procedimientos para la construcción de una escala de este tipo son: 1) Se construye 
una serie de ítems (alrededor de 150). 2) Se solicita a un grupo de jueces (más o menos 
100) que ubiquen los ítems en una escala de 11 puntos. 3) Una vez evaluados los ítems 
por los jueces, se adjudica a los ítems valores de escala. 4) Se seleccionan los ítems que 
representan el rango entero de la escala, rechazando los ítems ambiguos. 

Detallamos cada uno de los pasos: 


1) La construcción de los ítems (versión de los jueces) 


Construya entre 100 y 200 ítems tomando en consideración los siguientes criterios (ver 
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Edwards, A. L., para mayores detalles): 

а) Evite los ítems que señalan el pasado en vez del presente. 

Б) Evite los ítems que dan demasiada información sobre hechos о los que fácilmente 
puedan ser interpretados como tales. 

с) Evite los ítems ambiguos. 

d) Evite los ítems irrelevantes con respecto a las actitudes que pretende medir. 

e) Evite los ítems con los cuales todos o nadie concuerda. 

f) Los ítems deben ser formulados en un lenguaje simple, claro y directo. 

g) Sólo en casos excepcionales sobrepase las 20 palabras en un ítem. 

h) Un ítem sólo debe contener una frase lógica. 

і) Los ítems que incluyan palabras como “todos”, “siempre”, “nadie”, “nunca”, etc. 
serán percibidos de la misma manera y por ello deben omitirse. 

j) De ser posible, los ítems deben ser formulados como frases simples у no 
compuestas. 

k) Use sólo palabras que el entrevistado pueda comprender. 

1) Evite las negaciones, especialmente las dobles negaciones. 

m) Combine los ítems formulados positiva, neutral y negativamente en una 
proporción de 1/3, 1/3 y 1/3, distribuidos uniformemente sobre la variable. 

Algunas maneras de formular ítems pueden ser: i) Extraerlos de libros, publicaciones 
y artículos que tratan sobre el objeto cuya actitud se quiere medir. Son importantes 
también las declaraciones y los discursos, a partir de los cuales uno pueda hacer una 
especie de análisis de contenido. Cuando se sigue esta estrategia hay que tener en cuenta 
que un buen monto de reformulación уа a ser necesario. ii) Concertar una discusión entre 
personas que representan distintos puntos de vista con respecto a la actitud. En este caso 
la grabación de la discusión facilitará la selección de frases adecuadas. Aquí también 
será necesaria la reformulación. iii) Formular uno mismo, о en cooperación con otros 
investigadores, los enunciados ante los cuales se espera que la gente reaccione en forma 
positiva, negativa o neutra. 

En todo caso nunca es fácil llegar a la enunciación de 100-200 ítems sin incurrir en 
repeticiones o en formulaciones muy similares. Es importante, por cierto, que la 
distribución de los ítems a presentar a los jueces sea aproximadamente pareja, 
conteniendo un tercio de ítems positivos, negativos y neutros, a lo largo de un continuo. 


2) La administración a los jueces 


La lista de ítems (100 a 200) se distribuye a jueces (preferiblemente 200, con un mínimo 
de 50), los cuales van a ubicar los ítems en una escala intervalo-subjetiva que va de 1 a 
11 puntos. 

Los jueces son seleccionados en función de su conocimiento sobre el problema que se 
quiera medir; y en la clasificación o evaluación de los ítems no importa la opinión 
personal del juez, sino su evaluación del punto en la escala continua de 1 a 11 en el cual 
él ubica el ítem (es decir, la determinación del peso que el Пет tiene en su opinión para 
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la medición de la actitud). 
Las instrucciones a los jueces —que operan en forma independiente— pueden ser las 
siguientes: 


EJEMPLO: ESCALA ACTITUD TIPO THURSTONE 


Instrucciones 


El Seminario de Recolección y Análisis de Datos del Centro de Estudios Sociológicos de 
El Colegio de México está realizando una serie de ejercicios sobre construcción de 
escalas para la medición de actitudes. 

En el presente caso, tiene usted en sus manos una serie de afirmaciones para construir 
una escala de tipo Thurstone. La escala de intervalos aparentemente iguales de Thurstone 
parte de una serie de supuestos y técnicas en la cual los ítems son escalonados de manera 
tal que expresen un continuo subyacente. El continuo se edifica sobre una serie de 
juicios de actitud distribuidos en una escala de 11 puntos. 


Neutral —————› 
——— —— — + + +++ 
Radicalismo Conservadurismo 


El punto 1 representa una actitud extrema (en nuestro caso: radicalismo), el punto 6 
una actitud neutra (ni radical ni conservador) y el punto 11 el extremo conservador. 

Para la construcción de esta escala, se requiere someter una cantidad de ítems a un 
número limitado de jueces antes de ser aplicada a una muestra de una determinada 
población. 

Los jueces se eligen entre personas que tienen conocimientos especializados sobre la 
variable que se trata de medir, como ha sido el caso con usted. 

En el presente caso, se trata de construir una escala que mida actitudes de 
radicalismo-conservadurismo. Quisiéramos pedirle que, en relación a esto, no vuelque 
usted sus propias opiniones acerca de las afirmaciones que aparecen a continuación, sino 
que usted exprese su juicio acerca de cuán radical, conservadora o neutra le parece cada 
una de las afirmaciones. 

A la izquierda de cada afirmación hay un cuadrado en el cual usted debe colocar, de 
acuerdo a su criterio, el número que representa la frase en el continuo de 1 a 11, siendo: 
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1 еі extremo “radical”, 


6 el punto medio o “neutral”, 
11 el extremo “conservador”, 


=-—=- 


Si cree que la expresión se ubica entre alguno de estos puntos, utilice el número 
intermedio que mejor represente la posición de la frase. No trate de obtener el mismo 
número de ítems, o cualquier otra distribución espacial, en el continuo de 1 a 11. 

Por favor, antes de empezar, lea una buena cantidad de expresiones para entender el 
carácter de los ítems. 

Queremos insistir en que no se trata de dar una opinión personal de acuerdo o 
desacuerdo acerca de cada afirmación, sino solamente de estimar su lugar en una escala 
de l a 11 puntos. 


[Para el ejemplo presentamos solamente los primeros 29 items] 


1. El modelo desarrollista fortalece la desigualdad social. 


2. Tratándose de programas políticos, “más vale malo conocido que bueno 
por conocer”. 


3. Todos los asuntos económicos de interés nacional deben estar a cargo 
exclusivo del Estado. 


4. Los trabajadores deben tomar en sus manos la conducción del Estado; el 
Estado debe tomar en sus manos la conducción de la economía. 


5. La desigualdad social ha existido siempre, y es necesaria para el 
desarrollo de la sociedad. 


6. Los sindicatos deberían limitar sus actividades a las reivindicaciones 
económicas de sus representados. 


La función del Estado es la de participar dinámicamente en el desarrollo 
económico, social y político del país. 


8. La propiedad privada es un derecho natural del hombre y debe ser 
respetado y mantenido. 


9. Las políticas sobre la distribución del ingreso son pura demagogia que 
sólo propician el enriquecimiento de los políticos. 


10. La principal causa de la inflación es el anhelo de los empresarios de 
aumentar sus ganancias. 


11. El Estado debería dejar absolutamente a criterio de los padres de familia 
el tipo de educación que prefieren para sus hijos. 


12. Todo grupo de interés debe tener igual representación ante el Estado. 


H0 0 0 0 0 0 0 0 0 гп 00 
ра! 


13. Los trabajadores producen la riqueza; los patrones se Іа embolsan. 
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14. 


15. 
16. 


17. 
18. 


19. 


20. 


21. 


22. 


23. 


24. 


25. 


26. 


27]: 


28. 


29, 


La política del control de la natalidad es una política al servicio del 
imperialismo. 
Los que más pierden con la inflación son los empresarios. 


La importancia creciente del sindicalismo en el país representa un 
peligro para la democracia. 


Antes de la Reforma Agraria se producía más y mejor en el campo. 

La mejor manera de resolver los problemas es encontrar el justo 
“término medio” y no caer en los extremos. 

No se trata del sistema tal o cual; para que el país progrese hay que 
trabajar más, y punto. 

El camino de México es el de una economía mixta: el gobierno como 
promotor, y la iniciativa privada como participante activo en el proceso 
de desarrollo. 

El éxito se debe al esfuerzo personal. 

La nacionalización de la industria minera sólo caería en el burocratismo 
y la mala administración estatal. 

La mejor forma de representación ante el Estado es a través de grupos de 
interés, y no a través de partidos políticos. 

La intervención del gobierno en la economía agrícola sólo ha traído 
desorden y caos. 

El deficiente desarrollo agrícola del país se debe a la apatía y flojera de 
los campesinos. 

La Revolución mexicana será verdadera sólo cuando se realice una 
reforma agraria total. 

La fuerza política de un grupo debe ser independiente del poder 
económico de sus miembros. 

La actividad económica es privativa de los particulares y el Estado debe 
limitarse a coordinar tal actividad. 

El marxismo es una doctrina exótica que no toma en cuenta nuestra 
idiosincrasia ni nuestra tradición. 


3) Asignación de valores de escala 


Vamos a estudiar ahora la distribución de las respuestas (de 1 a 11) en cada ítem, según 
las respuestas sobre ubicación del ítem dadas por los jueces. Podríamos calcular los 
valores promedios (media aritmética) y las desviaciones estándar (с), para cada ítem. Sin 
embargo —y aquí de hecho se revela que la escala es más ordinal que intervalar—, 
existe mayor exactitud y representa un método más rápido el calcular valores de mediana 
(Мап) y de distancia intercuartil (О;-О;). En las siguientes páginas ilustramos con 
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ejemplos de análisis gráficos. (Ver cuadros 5, 6 y 7.) 

En el primer ejemplo (cuadro 5) hemos obtenido una mediana de 2.3. La mediana 
indica el “valor” del ítem a lo largo de la variable, es decir que se trata en este caso de un 
ítem al lado positivo de la escala (muy dogmático). La distancia intercuartil es igual a 
2.2. Esta cifra indica la “calidad” del ítem. Si menor la distancia intercuartil, mayor el 
grado de “calidad” del ítem, es decir que la adjudicación del valor del ítem por parte de 
los jueces es similar. Los valores altos de distancia intercuartil, por el contrario, indican 
diferencias entre los jueces en cuanto a la apreciación sobre el valor adjudicado al ítem. 

El ejemplo 2 (cuadro 6) indica el caso ideal, en el que todos los jueces están de 
acuerdo en cuanto al valor que debe ser adjudicado al ítem. 

El ejemplo 3 (cuadro 7) representa un ítem de escasa utilidad, ya que como se ve los 
jueces le adjudicaron valores muy distintos, representando el valor mediano del ítem una 
adjudicación casi aleatoria de los jueces en cuanto al valor 1, 2, 3... u 11 que se le 
adjudique al ítem como expresando una posición en el continuo. 

En los tres ejemplos presentados se han utilizado 56 jueces, y el método para calcular 
la mediana y los cuartiles ha sido proyectando líneas sobre la distribución gráfica. A 
partir de la distribución de frecuencias sobre los valores de ítems (1 a 11), resulta simple 
calcular la mediana y los cuartiles según las siguientes fórmulas: 


> 


MN 


Mdn=v+i E 


Donde: 


v; = Límite exacto inferior del intervalo que contiene la mediana. 
i = Amplitud del intervalo de clase (en nuestro caso igual a 1). 
N = Número de casos. 
Е. = Suma total de las frecuencias inferiores al intervalo que contiene la 


mediana. 
Е„ = Frecuencias del intervalo que contiene la mediana. 


Para el cálculo de cuartiles: 


N м 
Саш Fa 
О, =u —i 
8 ГА 
М . 
9 
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Солрко 5. Ejemplo l: Escala de actitud Шет bueno tipo Thurstone 
mide dogmatismo 


Item núm. [173] 
Caja núm. 3 
FT 2А КУУ HA 777 77 
Frecuencia a ai m Ё 
//, 
|а | 
цене ораи 
a 
a СОС 


Porcentaje 
cumulativo 


100 % 


0% 


| | 
Мап = 2,3 


1 
0,-0,= 7, 2 
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Солро 6. Ejemplo 2. Escala de actitudes tipo Thurstone. Ítem ideal 


Ítem núm. Cx] 
1 2 3 4 5 6 7 8 9 10 11 


Caja núm. 


Frecuencia 


Frecuencia 
en números 


Frecuencia 


56 
cumulativa jueces 
Porcentaje 
cumulativo 


і 2 3 4 5 6 7 8 9 10 11 


Representación gráfica y cálculo de Mdn y A 
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Cuabro 7. 


Item núm. 
7 


Caja núm. 1 - 3 4 5 6 


Frecuencia 


Frecuencia 
en números 


Frecuencia 
cumulativa 


Porcentaje 
cumulativo 


1 2 3 4 5 6 7 8 © + H 
100 % 
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Donde: 


о, = Límite exacto superior del intervalo que contiene el cuartil. 
v; = Límite exacto inferior del intervalo que contiene el cuartil. 
i = Amplitud del intervalo de clase. 
F, = Frecuencias por encima del intervalo que contiene el cuartil. 
F¿=Suma total de frecuencias por debajo del intervalo que contiene el 
cuartil. 
F, = Frecuencias en el intervalo que contiene el cuartil. 


4) La selección de los ítems 


La selección final de los ítems presentados a los jueces se realiza en base a los valores de 
la mediana, y de amplitud intercuartil. La mediana se utiliza para ubicar el peso del ítem 
en la escala, eligiendo los items que se hallen repartidos uniformemente a lo largo de la 
misma. Necesitamos aproximadamente 2 ítems para cada intervalo de la escala (1-2; 2-3; 
3-4 ... 9-10; 10-11). 


FIGURA 3. 


1 2 3 Е 5 6 7 8 9 10 1 
Mediana 


La distancia intercuartil es utilizada para decidir cuáles son los mejores ítems dentro de 
cada intervalo. La figura 3 indica una distribución de ítems en la cual en el eje horizontal 
figuran los valores de mediana, y en el eje vertical los valores de distancia intercuartil. 
Los ítems seleccionados para la escala final están marcados con círculos y son 
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obviamente aquellos que, representando cada uno de los intervalos еп la escala, 
presentan distancias intercuartiles mínimas. 

Normalmente las distancias intercuartiles más grandes se presentan en el centro de la 
escala. Ocurre muchas veces que la selección de ítems para los valores 5, 6, 7 y 8 se 
complica en la medida en que los jueces tienden a dispersar sus evaluaciones 
fuertemente en el centro; es decir, esto se va a reflejar en distancias intercuartiles 
bastante grandes. Si no se obtienen suficientes ítems en la primera versión de los jueces, 
el investigador deberá construir más ítems para esta área, que deben ser juzgados 
nuevamente por los mismos jueces. Conviene por supuesto anticiparse a este tipo de 
problemas, teniendo especial cuidado cuando se construyen los ítems iniciales. 


B) La versión final de la escala 


Está constituida por los 15 o 25 ítems seleccionados como confiables. Los ítems son 
presentados a los sujetos solamente con dos alternativas de respuestas: acuerdo- 
desacuerdo. 

La forma de presentación de la escala es diferente de aquella presentada a los jueces. 
En un cuestionario, por ejemplo, se eliminan las “cajas”, solicitando al sujeto que 
responda únicamente si está de acuerdo o en desacuerdo con cada uno de los juicios. 

A manera de ejemplo, presentamos algunos ítems que han sido contestados por un 
sujeto hipotético. 


l. El éxito se debe al esfuerzo per- БІ De acuerdo 
sonal, C] En desacuerdo 
2. El futuro nos deparará mejores Г] De acuerdo 
condiciones de vida. X] En desacuerdo 
3. El gobierno debería tomar todas Г] De acuerdo 
las decisiones. En desacuerdo 
4. Casi nadie considera el trabajo Г] De acuerdo 
que yo hago. En desacuerdo 
5. Es bueno que la Iglesia se mo- O De acuerdo 
dernice. En desacuerdo 
6. Yo no podría ser bueno de ca- De acuerdo 
rácter. Г] En desacuerdo 
Etcétera. 


3) La adjudicación de puntajes a los sujetos 
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El investigador tiene que registrar еп un código los valores de mediana adjudicados por 
los jueces a los ítems seleccionados para integrar la versión final de la escala. Los 
valores intercuartiles no se utilizan para el cómputo de los puntajes finales de los sujetos. 
El puntaje final de un sujeto será entonces simplemente el promedio de los valores de 
escala de los ítems respondidos en forma afirmativa o “de acuerdo”. 

Supongamos que nuestro sujeto hipotético haya respondido “de acuerdo” únicamente 
a los ítems 1 y 6; es decir que en el resto de los ítems su respuesta ha sido “en 
desacuerdo”. Supongamos entonces que los valores de escala dados por los jueces hayan 
sido: 


Item Peso del ¡tem en la variable 


1.2 
4.6 


ON O) Ot Ha сого не 
—— 
© 
со 


etc. etc. 


Consecuentemente, el puntaje correspondiente a nuestro sujeto será: 


Los valores en la escala utilizados como una variable en el análisis de alguna 
investigación pueden también ser utilizados de varias formas. Se pueden tomar los 
distintos valores en los sujetos y establecer correlaciones entre la actitud y alguna otra 
variable, o bien dicotomizar las respuestas de la siguiente manera: 


193 


Peso en la escala 


Thurstone Núm. de individuos Frecuencias acumulativas 

1 34 34 

2 54 88 

3 42 130 

4 39 169 grupo 

5 15 184 

6 5 189 alto 

7 52 241 

8 Dicotomización 84 325 

9 82 ро 
10 72 bajo 
11 121 

600. 


Supongamos que la distribución en nuestra variable entre 600 individuos en una 
encuesta es como aparece en la página anterior (supongamos que todos han contestado la 
pregunta). 


Lo que hicimos con la distribución fue lo siguiente: 


a) Contabilizamos el número de sujetos que obtuvieron los diferentes puntajes en la 
escala; aquí particularmente ubicamos a los sujetos que obtuvieron, por ejemplo, 4.6 en 
el intervalo 5. Nótese que, entonces, la amplitud de cada intervalo de “peso en la escala”, 
para el caso del intervalo 5, va de 4.5 a 5.49. 

b) Calculamos las frecuencias acumuladas, 

c) Si buscamos dicotomizar la variable, el estadístico a utilizar sería la mediana, que 
en nuestro caso tiene un valor igual a 8.2, es decir, cae en la categoría 7.5 a 8.49. 

d) Procedemos entonces a la dicotomización y obtenemos 2 grupos, a los cuales les 
llamaremos grupo alto y grupo bajo. 

e) Podemos cruzar entonces nuestra variable con alguna otra, tal como figura en el 
ejemplo, 
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Variable Y (otra variable cualquiera) 


Alto Mediano Вајо 


Variable X Grupo 

(Thurstone) alto 
Grupo 
bajo 


C) Comentarios 


1) Ítems o series de items acumulativos o diferenciados 


Los ítems de la escala Thurstone son ítems diferenciadores. Presentamos algunos 
ejemplos de diferentes ítems en una escala Thurstone. (Ver en la página siguiente.) 

El eje horizontal representa todas las personas investigadas ordenadas en tal forma 
que las que detentan una actitud más negativa con respecto a la variable se ubican a la 
izquierda y las más positivas a la derecha. En el eje vertical está representado el 
porcentaje de respuestas “de acuerdo” en un ítem. 


curva ítem 1 


curva ítem 3 
porcentaje de 


respuesta “si” 


personas negativas 
a la variable 


personas positivas 
a la variable 


ítem 1: es un ítem que recibe respuestas “No” de las personas que tienen una fuerte 
posición ya sea positiva o negativa. Un grupo de personas que tengan una determinada 
posición a lo largo de la escala responderán este ítem con un “Si”. En el caso del ítem 2, 
la única diferencia es que solamente el 50% de las personas responderá “Sí” al ítem en el 
lugar de la escala donde la probabilidad de alta tasa de respuestas “Sí” es más grande. El 
ítem 3 es un ítem donde el 100% de los respondentes con ciertas posiciones en la escala 
responderán “Sí” y todos los demás “No”. Ejemplo: “¿Está usted entre los 178 y los 179 
cm de estatura?” 

La escala Thurstone en su totalidad forma una serie de ítems diferenciadores. La 
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siguiente figura puede dar una idea de la estructura de una escala Thurstone. Hemos 
reducido el número de ítems a 6 para facilitar la lectura de la figura. 


porcentaje de 
respuestas “si” 


personas negativas personas positivas 
a la variable a la variable 


2) La variación en el instrumento, los sujetos o ambos 


En la escala de Thurstone, solamente el estímulo aislado recibe valor en la escala. El 
conjunto de tareas para los jueces es escoger los ítems dentro de los intervalos de 
igualdad-apariencia (11 cajas) tratando de disminuir cualquier variación debido a su 
propia posición con respecto a la actitud. Es decir que en el caso de la escala Thurstone 
tenemos el enfoque que corresponde a la variación centrado en el instrumento. La escala 
Thurstone entonces pertenece al test Tipo B de Coombs. 


3) El problema con las dimensiones 


Una desventaja de la escala de Thurstone es la dificultad de controlar las dimensiones en 
la variable. Supongamos que una persona ha contestado “de acuerdo” a los siguientes 
ítems de una escala Thurstone de 30 ítems: 


Пет Valor 
4 5.9 

9 6.2 

11 6.9 
19 7.2 
28 7.8 
34.0 

А 0 
Ѕи рготейіо ез епіопсеѕ = 6.8 


5 


Pudo haber recibido esa suma particular mediante una serie de operaciones. Los cinco 
ítems con los que concordó pudieron haber tenido asignados los números 4.1; 4.2; 8.7; 
8.5; 8.9 o por ejemplo: 1.9; 2.2; 7.4; 10.7 y 10.8. En ambos casos el promedio es 6.8. Las 
posibilidades aumentan todavía más si consideramos que, de hecho, el individuo podía 
haber concordado con más o menos de 5 ítems. ¿Cuál podría ser la razón de esto? Como 
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simplificación gruesa del problema podemos pensar que la serie 4.1; 4.2; 8.7; 8.5 y 8.9 
indica dos dimensiones, una de las cuales aparece alrededor de 4 y la otra alrededor de 9. 
Aparentemente, los dos primeros ítems tienen para el sujeto un significado distinto de los 
tres siguientes. Para controlar esta desventaja de la escala, Thurstone y Chave (1929) 
proveyeron a la escala de un criterio burdo basado en las respuestas: el llamado index of 
similarity (índice de similitud). 


D) Ventajas y desventajas de la escala Thurstone 


Ventajas. a) La principal ventaja de esta técnica es que permite hacer una distribución de 
un grupo dado, a lo largo de la actitud que se desea investigar, precisamente porque los 
ítems fueron diseñados y seleccionados a los efectos de cubrir el continuo. b) Supone 
una medida más refinada que la escala Lickert, ya que el puntaje de los ítems se deriva 
de una ponderación basada en el juicio de jueces expertos o al menos informados. c) En 
la medida en que la escala final contiene más ítems que la de Lickert, es más confiable 
que ésta. d) Si es tratada como escala intervalar, permite comparar puntuaciones y 
cambios de actitud en los sujetos. 

Desventajas. a) Su elaboración es larga y compleja. b) Pese a su tratamiento como 
escala intervalar, su verdadera naturaleza en términos de nivel de medición corresponde 
al nivel ordinal. c) Fácilmente se introducen otras dimensiones distintas de las que se 
quiere medir. d) Discrimina poco en los extremos de la distribución. e) Los ítems 
neutrales carecen de significado mayor, y a menudo se ubican en esta posición ítems que 
no se refieren a la dimensión tratada. f) Distintas configuraciones de respuesta resultan 
en el mismo puntaje final. g) Los jueces pueden introducir sesgos difíciles de detectar. 


LA ESCALA GUTTMAN 


Una de las desventajas mayores en las dos escalas que examinamos hasta ahora — 
Lickert y Thurstone— era que ninguna de ellas garantiza que el instrumento mida una 
dimensión única. 

La escala Guttman, conocida como método del escalograma о análisis de 
escalograma, soluciona el problema de la unidimensionalidad. Su objetivo es definir lo 
más claramente posible qué es lo que está midiendo la escala, entendido esto como un 
problema de unidimensionalidad. Por el tipo especial de tratamiento al que se somete la 
escala se busca la eliminación de factores extraños a la característica o dimensión que se 
pretende medir. 

La escala Guttman es de tipo acumulativo, ya que la respuesta positiva a un ítem 
supone que los ítems anteriores también han sido respondidos en forma positiva. Se 
busca pues una coherencia en las pautas de respuesta de los sujetos, y esa coherencia es 
garantizada por medio de un coeficiente de reproducibilidad. El tamaño del coeficiente 
(valor máximo 1.00) señala el grado por el cual la escala es acumulativamente perfecta o 
casi perfecta. En una escala cuya reproductividad es perfecta, las respuestas de los 
sujetos a todos los ítems pueden ser reproducidas рог el solo conocimiento de su 
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posición de rango. 

Veremos más adelante que, además de la reproductividad, hay que tomar en cuenta 
otros factores, tales como el alcance de la distribución marginal, la pauta de los errores, 
el número de ítems en la escala y el número de categorías de respuesta. 

El método de escalograma de Guttman combina aspectos de construcción utilizados 
en las escalas Lickert y Thurstone, además de los distintos cálculos de los coeficientes 
mencionados en el parágrafo anterior, en razón de que utiliza 2 técnicas: a) Siguiendo 
los procedimientos de la escala Lickert; y b) La técnica de la escala discriminatoria de 
Edwards y Kilpatrick. Vamos a desarrollar primero los procedimientos siguiendo las 
técnicas de Lickert y luego utilizaremos la técnica de Edwards y Kilpatrick. 


A) La construcción de un escalograma Guttman 


Los pasos a dar en la construcción de una escala de este tipo son: 1) Se construye una 
serie de ítems relevantes a la actitud que se quiere medir. 2) Se administran los ítems a 
una muestra de sujetos que van a actuar como jueces. 3) Se asignan puntajes a los ítems 
según la dirección positiva o negativa del ítem. 4) Análisis de ítems para la formación de 
series acumulativas. 5) En base a los ítems seleccionados se construye la escala final. 

En los pasos 1, 2 y 3 se siguen los procedimientos señalados en la escala Lickert para 
la construcción de ítems, la administración a los jueces y la asignación de puntajes (ver 
escala Lickert). 


4) El análisis de los ítems 


Una vez aplicados los ítems a los jueces, procedemos al análisis de los ítems en su 
conjunto. La idea es formar una serie acumulativa de ítems. Para ello, vamos a diseñar 
un escalograma. 

a) Primero computamos el puntaje total para cada uno de los jueces (es decir, 
sumamos los valores obtenidos en cada uno de los ítems). 

b) Ordenamos a los jueces según el puntaje total, desde el puntaje más alto al puntaje 
más bajo. 

Si nuestra serie de ítems fuese perfecta, todas las celdas cruzadas (crossed cells) en el 
escalograma estarían en una posición sobre una diagonal que corre desde el ángulo 
superior izquierdo hasta el ángulo inferior derecho. Mientras más alto sea el número de 
desviaciones a esta diagonal, más baja será la reproducibilidad y menos idéntica a una 
serie de Пет acumulativos será nuestra serie. 

Antes de entrar en un análisis en detalle del cuadro 8, vamos a mostrar un 
escalograma más simple con el fin de clarificar la idea de acumulación y de error. 

Supongamos que 20 jueces hayan respondido a 6 ítems en términos de “acuerdo” o 
“desacuerdo”. Ordenamos a los jueces, figurando en el cuadro 8 los “acuerdos” con una 
х, y los “desacuerdos” con una O. La distribución se muestra en el cuadro 8. 

El cuadro 8 muestra una serie de ítems escalonados. El ítem 4 ocupa la primera 
posición en la escala en razón de que se dieron en él 3 respuestas positivas (de acuerdo); 
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el Пет 2 ocupa el segundo lugar ya que se dieron б respuestas positivas, y así 
sucesivamente hasta llegar al último ítem, el número 3, con el que acordaron 16 de los 
20 jueces. 

En términos de escalograma, las respuestas redondeadas con un círculo son “errores”, 


esto es, respuestas que caen fuera de la pauta general del escalograma señalado con la 
línea segmentada. 


El cuadro analítico para el cuadro 8 sería: 


Número de preguntas: 6 
Número de jueces: 20 
Cantidad total de respuestas: 6 Хх 20 = 120 
Cantidad de errores: 7 


Cantidad de errores 
Reproducibilidad = 1 — ( O ) =0.94 


Cantidad total de respuestas 


Compliquemos un poco el ejemplo, utilizando 5 categorías o alternativas de cada ítem. 
Supongamos que 30 jueces han juzgado 6 ítems en una escala de 5 puntos: 


4— Muy de acuerdo 


3— De acuerdo 
2—  Indeciso 
1— Еп desacuerdo 


0— Muy en desacuerdo 
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CuADro 8. Análisis de escalograma. Respuestas de 20 jueces a 6 ítems 
en términos de acuerdo-desacuerdo 


Rango 
del 
juez Puntaje 


1 6 
2 
3 


4 


гы м и 
| 
о om 


— 
N 
o © > > © © © ээ єє > бф эс M CO.“ Ф| 
ка 
ш 


чл 
инин | 
r 
с; ————! 
a 
- 
O xxx»: хх (бух >>: хох ох ох 
= ә w м мә м м vw м > “e ым 


° о о о о о ө э оооххх (ххх x 
=== 


con. ..oo. oo ojxMxxxxox xoxo 
і 
о ооо орх хххххх(б ххх жох х 


э о о ө ө ө 5 о ө о ө о о о|х хх ж х 


o ojx 


ә, 
© 
со 
— 
— 
— 
++ 
— 
е 


Es decir, que teóricamente los puntajes уап a variar desde un máximo de 24 puntos а 
un mínimo de 0. 
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El cuadro 9 señala la ordenación de los jueces, y el puntaje obtenido еп cada uno de 
los ítems. Considerando la dispersión sobre todas las alternativas de la escala, vemos que 
la probabilidad de obtener una escala acumulativamente perfecta disminuye en la medida 
en que se trata ahora de que haya escalabilidad entre los ítems y en el interior de un ítem. 

Si examinamos el ítem 1 encontramos que hay 8 personas con respuesta 4 (“muy de 
acuerdo”); 10 personas con respuesta 3 (“de acuerdo”); 4 personas con respuesta 2 
(“indeciso”); 4 personas con respuesta 1 (“еп desacuerdo”), y 4 personas con respuesta 0 
(“muy en desacuerdo”). De haber escalabilidad perfecta en el Пет, deberíamos esperar 
que todos los jueces con respuesta 4 se coloquen en un orden de rango por encima de 
aquellos que dieron respuesta 3. No ocurre así, ya que sólo 3 de ellos están claramente 
por encima, mientras que hay sujetos con puntaje 3 e incluso un sujeto con puntaje 1 que 
aparecen en un orden de rango superior. Si observamos los sujetos con puntuación 2 
vemos que están perfectamente ordenados en relación a los que tienen puntaje 3 y 4. En 
los sujetos con puntaje 1 vemos que existen dos sujetos mal ubicados (dos errores) en 
relación al ordenamiento escalable. De los 4 sujetos que tienen puntaje O en el ítem, 3 
están fuera de posición. 
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Солрво 9. Análisis de escalograma. Ordenación de puntajes y valores 
de respuesta en 6 ítems tipo escala Lickert (30 jueces) 


a ИШ 
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ЕВЫ M ШЕЙ: E ШЇ ТЕТ o КЁ ЖО O 


PS 
КЫ 
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а 
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ES 
шшш: 


ББ 
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m 
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ККУ Ку ЖӨ! ЭШ ЭЁ ШЖК ИШ ЖЛЕ ЖН ИШ ИЕ ФС ЫП ЕШ ПЕ ЕЙ Шш: ЖЕ ШЕ ШТ 


ME PR + 
ГА ГЕТ КЕКЕ ЕЕ 
WAR AA SEMEN IEA AE 


wu w -A -A С J 00 00 Со бо 


Podríamos hacer un escalograma con el ítem 1, de la misma manera como lo hicimos 
en el cuadro 1, y contar el número de errores. 
Considerando la dispersión sobre todas las alternativas de la escala, la probabilidad de 


obtener una serie acumulativa de ítems en el ejemplo del cuadro 9 disminuye, en 


relación con el ejemplo del cuadro 8. Mediante la unificación de algunas categorías de 
respuesta de distintas maneras, podríamos tratar de aumentar la reproducibilidad de la 


escala. 


Las técnicas que se utilizan para este propósito son diferentes. Se puede recurrir 


202 


directamente a máquinas electrónicas para procesamiento de datos, a alguna técnica de 
“tablas de escalograma” (scalogram board techniques), o un procedimiento más 
complicado y que implica pérdida de tiempo como el de “ensayo y error”. 

Volviendo al ejemplo original del cuadro 9, tenemos errores o muchos sujetos fuera 
de posición dondequiera que pongamos la diagonal o los cortes. Se tratará entonces de 
combinar las respuestas de manera que podamos representar un nuevo continuum en el 
cual, por ejemplo, se combinen respuestas “muy de acuerdo” con respuestas “de 
acuerdo”, o cualquier combinación que indique escalabilidad. Esto significa que el 
criterio por el que nos guiamos para la combinación de respuestas es empírico, 
esperando que, si efectivamente el ítem discrimina, ordenará las pautas de 
discriminación con una combinación tal que minimice el error. Cuando el ítem no 
discrimina, es decir, cuando cualquier combinación produce un número grande de 
errores (y grande significa simplemente que el número de aciertos es menor que el 
número de errores, o que no existe una desproporción significativa entre aciertos y 
errores que nos dará como resultado un coeficiente de reproducción satisfactorio), el 
ítem no es escalable y se elimina. 

En el ítem 1 podemos dejar las categorías 4 y 3 separadas, y combinar las categorías 
de respuesta 2, 1 y 0. En el ítem 2 combinamos las categorías de respuesta 4 y 3, por un 
lado, y 2, 1 y 0 por el otro, etcétera. 

Supongamos que las combinaciones propuestas para cada ítem y sus respectivos 
pesos son ahora: 


Ítem Combinaciones Nuevos pesos 
1 4 3 210 = 4 
2 4,3 2,1,0 2 0 
3 4,3 2,1,0 2 0 
4 4,3,2 1,0 2 0 
5 4,3 2,1,0 2 0 
6 432 1,0 2 0 


La distribución de los puntajes en los ítems adquiere ahora la siguiente forma: 
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Cuapro 10 


ЕЛЕЕ 


A 
54 54 54 


AA 
““ AAA AA A A 04 04 04 04 


я AAA A A 


AX ж 
A AA = AAA A A A 


AAA AAA A PA A AA 


9 
9 
8 
7 
6 
5 
5 
5 
4 
4 
4 
2 
2 
2 
0 
0 
0 
0 
0 


DA DS DS DA DS 04 р 04 06 04 06 

па 06 04 04 04 06 04 DA 06 04 06 04 ра DS DS 
PODC 04 04 р4 04 04 06 54 06 04 06 94 ж 
“ххх AR ра хе» 
ПА А С р 4 04 06 06 04 ж 


Obsérvese que, con la nueva clasificación de los ítems, el ítem 6 no contiene ahora 
ningún error, siendo a su vez el que menos discrimina entre los puntajes extremos. Los 
ítems 2 y 3 escalan bastante bien y con poco error. El ítem 4 tiene algunos errores, 
mientras que el 5, a pesar de la dicotomización, contiene más errores que los demás. La 
distribución de los puntajes en el ítem 1 indica la necesidad de unir las nuevas categorías 
2 y 1 con el fin de reducir aún más el error. Tal como está el cuadro, su coeficiente de 
reproducibilidad será igual a: 
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CUADRO 11 


Ї tems 


—— 


Puntajes 


AMIA ое + 


e= n — а AA 


coso olx Mx AA AAA lu 
ADA AAA AAA AAA е DA 


ооо оон н н н м мм м ммо рь dv хл мл Viv vi Vi мл vi 
00000000000 o o |X X X KEK 5556 уе 5 w 
ооооо сіу уе убре рс 06 56 56 06 06 A ре рс C рс Ad « 


0 LX_ 
0 Ж 
0 I X 
0 Хх 
0 E: 
Ф Е 
0 0 | 
0 0 | 
0 L 
® 0 
0 
0 0 
0 0 
0 0 
0 0 


Total de errores 
Ty = i AA == l l = 913 
Total de respuestas 390 


Valor satisfactorio, sin embargo, si unimos las categorías 1 y 2 del ítem 1, y 


eliminamos el ítem 5; detenemos entonces el escalograma de la página anterior, en el 
cual los ítems aparecen ordenados por grado de dificultad. 
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Puede verse ahora que los errores han sido reducidos en forma considerable, aunque а 
costa de reducir la discriminación en el interior de los ítems, además de eliminar el ítem 
originalmente designado con el número 5. 

El lector notará que con los nuevos pesos asignados a los ítems se produce un 
reordenamiento en el rango de los jueces como consecuencia de la alteración en los 
puntajes totales. 

Las líneas segmentadas representan los puntos de cortes. 


B) La determinación de los errores 


Hay dos métodos que tienden a dar resultados diferentes: la técnica de Cornell y la 
técnica de Goodenough. 

Comencemos con la técnica de Cornell, la cual se realiza estableciendo puntos de 
separación en el orden de rango de los jueces, puntos que los separan en distintas 
categorías, tales como se definirían de ser la escala perfecta. Ésta es la técnica utilizada 
cuando señalábamos puntos de separación por medio de líneas segmentadas. Si 
observamos el cuadro 10, vemos que el ítem 1 necesita dos puntos de separación: el 
primero cae entre la última persona con puntaje 10 y la primera persona con puntaje 9. 
Todos los sujetos o jueces por encima de este punto de separación deberían tener puntaje 
2 en el ítem. En términos de errores encontramos pues 5 errores (cuatro por encima y 
uno por debajo del punto de separación). El siguiente punto de separación lo 
establecemos entre la última persona con puntaje 5 y la primera persona con puntaje 4. 
No existe ningún error. 

Finalmente, en el último punto de corte que corresponde al puntaje 0 tenemos 1 error. 
Así pues, el ítem 1 tiene un total de 6 errores. Puesto que hay 30 jueces y 3 categorías, el 
porcentaje de error es de 6.7%. Cuando el error es mayor que el 10% y el item permite 
reagrupación es necesario realizarla, o de lo contrario conviene eliminar el ítem. Se 
opera de la misma manera con los otros ítems. 

Para el cálculo del coeficiente de reproducibilidad por la Técnica de Cornell, hay que 
seguir entonces los siguientes pasos: a) Determinar los cutting points de manera tal que 
se minimicen los errores. b) Ningún cutting point debe estar tan por encima o tan por 
debajo que la categoría menor incluya menos del 10% de los jueces. c) Ningún cutting 
point debe ser realizado de manera tal que el número de errores sea mayor que el número 
de jueces en la categoría. 

Para controlar si el lector entendió la manera de calcular el coeficiente de 
reproducibilidad por la técnica de Cornell, lo invitamos a hacer el cálculo para el cuadro 
10 por su cuenta. Para los cutting points indicados en el cuadro, el coeficiente debe ser 
igual а .949. De hecho, habría que aclarar que el ítem 5 debería ser eliminado, con lo 
cual el coeficiente de reproducibilidad aumentaría a un valor aceptable, tal como vimos 
en el cuadro 11. 

La técnica de Goodenough es un poco más complicada y se basa en el cálculo de 
errores en base a pautas marginales. 
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Los cutting points en esta técnica se determinan según la distribución de las 
respuestas de los jueces a cada una de las alternativas en los distintos ítems. Los cálculos 
para el cuadro 10 nos darían los siguientes valores: 


Í tems 


ЕГ ЕЕЕ 
р ер р а [л [ле [+ [ж Гес 
27 3 47 | 53 |80 | 


EJEA 


Categorias 


Frecuencias 


5 50 | 47 


Porcentajes 


ЕСС 


Los cutting points рага cada uno de los ítems deben seguir entonces los porcentajes 
respectivos. En el caso del ítem 1, los cortes serían entonces: 


Es decir que, en el ítem 1, el primer corte o cutting point caería entre el primer sujeto 
con puntaje total 10 y el segundo con puntaje 10, y así sucesivamente para el resto de los 
Ítems. 

Mediante estos cutting points, se уап a determinar pautas de respuestas 
correspondientes a cada corte. La pauta de respuesta es la manera “correcta” en que 
deberían distribuirse para cada puntaje total de cada juez si la escala tuviera perfecta 
escalabilidad. Cada respuesta que no sigue la pauta de respuesta. ideal se considera un 
“error”. En nuestro ejemplo, un juez con puntaje de 8 debe seguir una pauta: 0-0-2-2— 
2—2. Un sujeto con puntaje 6 debe consecuentemente tener una pauta de respuesta 0-0— 
0—2—2—2. Es decir que primero hay que ordenar los ítems en términos de escalabilidad, 
para luego determinar las pautas correspondientes a cada valor. El principio de la técnica 
es bastante simple. Рага 4 ítems dicotomizados y con valores de 1 y 0 para alternativas 
de respuesta “de acuerdo” y “en desacuerdo”, respectivamente, un puntaje total de 3 
puede seguir cuatro tipos de pautas diferentes: 
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ш) 


O: 
В) 1 
] 
| 


= A A 
[Г ты шыр к= 


С 
ді) 
De estas pautas, solamente la primera es correcta, para ítems que están ordenados еп 


forma acumulativa. Cada una de las pautas b), c) y d) tiene respectivamente 2 errores 
(uno por tener un 1 donde debería haber un 0, y otro por tener un cero donde debería 


tener un 1). 
Puntaje 
| 0| total 


Pauta de respuesta 


га 


06 54 04 © хх 


D D< A DA DA DA DA DA DA| | 
Və 
ТЕЕ: g 


DA 54 pS S р ра PS pS ра 06 DS 

OO O tr нн ко м Y Y Y мә Y мо es 

A | 
Md.oO0o0oSooSocoomnoonmnoo 


Total errores 


Para hacer más claro el método, en la página anterior dimos un ejemplo más simple, 
en el que presentamos 4 ítems dicotomizados, las pautas de respuesta y el cálculo de los 
errores. 

El coeficiente de reproducibilidad se calcula según la fórmula ya conocida de: 


il Cantidad de errores 
: Número total de respuestas 


En el ejemplo arriba citado: 


208 


El coeficiente de reproducibilidad nos indica la proporción de respuestas a los ítems 
que pueden ser correctamente reproducidas. 


C) Ejemplos 


Veamos ahora dos ejemplos, a partir de los cuales presentaremos criterios adicionales al 
coeficiente de reproducibilidad para la determinación del universo de contenido en la 
escala Guttman. 

Cuadro de la página siguiente: escalograma Guttman para la medición de nivel de 
vida determinada en función de materiales empleados en la construcción de viviendas y 
de las instalaciones sanitarias. Muestra de población de Colombres, en el departamento 
de Santa Cruz, en Tucumán, Argentina. Respuestas de 33 jefes de familia (arq. 
Hernández, CES; Universidad de Tucumán, Argentina, 1966). 


REFERENCIAS 

Ejemplo B Ejemplo A 
Йет 1: Alejamiento de aguas servidas a Ítem 1: Pileta de lavado. 
| pozo ciego y fosa séptica. Пет 2: Inodoro. 
Пет 2: Agua corriente. Пет 3: Ducha. 
Item 3: Eliminador de residuos. Item 4: Revestimiento de cemento o su- 
Пет 4: Techo de cinc, loza o teja соп perior en baño o letrina. 

aislación. 


Ítem 5: Piso de cemento o mejor. 
Item 6: Luz eléctrica. 


209 


Ejemplo A: Vivienda 


Ejemplo B: Instalaciones sanitarias 


Ítems Ítems 
Sujetos Sujetos 
її XA Ж > 4 1 2 3 4 
1 E E A E о A 3 X X X X 
33 - ALAA A A 15 X X X X 
31 E E E XX A 17 X X X X 
22 + XX A EX XX XL 7 х х х X 
19 E E A E OA A 11 х х х X 
16 О E > + 30 х х х х 
4 E ххх A 2 X х х х 
6 х хх > A 1 X X X X 
3 E ъъ E Ж Ж 4 X х х х 
15 E E X E A 5 х х X X 
17 E LL A Ж A 8 х X X 
14 E ® E E Ж 6 х х х 
7 к 566 56 E 33 х X X 
2 > A = Ж ЖА 31 X X X 
18 E e ® O ж 22 х х X 
5 X X X X 19 X X X 
8 х х E A 16 х х х 
П ® ® Xx х 14 х х X 
30 X X X X 9 X 
29 X X X 18 х 
9 ж A 13 
13 A A 25 
10 X X 24 
26 E А 29 
28 х х 27 
24 х 26 
27 х 32 
20 X 12 
21 X 20 
25 28 
12 23 
23 10 
59 21 
Cálculo Universo de Contenido рага el cuadro 11: 
Ejemplo A Ejemplo B 
Coeficiente de reproducibilidad: ‚949 1.00 
Rango marginal mínimo: .72 .60 
Alcance de distribución marginal: .229 .40 
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El coeficiente de reproducibilidad еп el ejemplo В, cuyo valor es 1.00, nos permite 
decir, sin tener en cuenta la distribución gráfica, que el sujeto 18 tiene en su casa 
únicamente revestimiento de cemento (o mejor, en su baño), mientras que el sujeto 33, 
cuyo puntaje es 3, tiene revestimiento, inodoro y ducha, pero no pileta de lavado. 

Es muy difícil lograr escalabilidad perfecta, y consecuentemente existen errores que 
van a ser interpretados como errores de reproductividad. Guttman aconseja que los 
coeficientes de reproductividad no sean menores de .90. 

El coeficiente de reproductividad (r,) es un criterio necesario, pero no suficiente рага 
la determinación de la escalabilidad de los ítems. Deben tomarse en cuenta otros 


factores. Stouffer et al.? señalan cuatro criterios adicionales: /) Alcance de la 
distribución marginal; 2) Pauta de errores; 3) Número de ítems en la escala, y 4) Número 
de categorías de respuestas. 


1) Alcance de la distribución marginal 


Es el más importante de los criterios adicionales, y debe acompañar al coeficiente de 
reproductividad. El criterio de distribución marginal es determinado por el Rango 
Marginal Mínimo (M. M. R.), que consiste en el r, menos el promedio de los modos de las 
frecuencias relativas de las distribuciones de los ítems: (7, — ММК). 


Para algunos, los valores de este criterio adicional deben variar entre .15 y .35; para 
otros el mínimo debe ser mayor que .10. Estos valores indican la escalabilidad de los 
ítems, dato que no es proporcionado por el r, de manera completa (es decir, es posible 


alcanzar valores altos de r, —digamos .90— y resultar una escalabilidad inaceptable). 


Éste es el caso en el cual los cuttings points están muy próximos entre sí, con el 
resultado de discriminar solamente en los extremos de la escala y no a lo largo de la 
misma. En nuestro ejemplo, los valores de r, son altos y muy aceptables; los alcances de 


la distribución marginal, en cambio, son aceptables para el ejemplo 4, y demasiado altos 
para el ejemplo B. 


2) Pauta de errores 


Cuando el r, es menor que .90, pero es escalable, es decir que tiene un r, М. M. R. mayor 


que .10, estamos en presencia de más de una variable; mejor dicho, de una variable 
dominante y de otra u otras menores, en el área a través de la cual se ordenan los sujetos. 
Este tipo de escalograma es denominado cuasi-escala. Éste no es el caso de los dos 
ejemplos que presentamos. 


3) Número de ítems en la escala 


A mayor número de ítems, mayor la seguridad de que el universo (del cual estos ítems 
son una muestra) es escalable. Es por esto que cuando los ítems están dicotomizados, 
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como es el caso en nuestros ejemplos, es aconsejable que su número sea mayor que 10. 
Pero puede usarse un número menor de ítems si las frecuencias marginales se colocan en 
un rango con recorridos del 30% al 70%. 

En los ejemplos dados por nosotros el rango de frecuencias es: 


Ejemplo A Ejemplo B 
7 den don 24%, 20257 A 30% 
¿A аахсан 57% Ítem E aci 559%, 
o AAA 60%, E A 55%, 
LEE morra no 69%, г. Ты AX 60%, 
ПЕШ ЖИН 789%, 
Паш чыннан 87% 


De acuerdo al requisito citado más arriba tenemos así alguna seguridad de que el 
universo se comporta como la muestra. 


4) Número de categorías de respuestas 


Es otro criterio para asegurar la escalabilidad; cuanto mayor el número de categorías, 
mayor la seguridad de que el universo es escalable. Por ello, a pesar de la necesidad de 
reducir las categorías por razones prácticas (disminución del número de errores), hay que 
asegurarse de que tal reducción no es la resultante de obtener frecuencias marginales 
extremas (.90—.10) que, como vimos más arriba, no permiten errores, pero 
artificialmente. 

51 mantenemos el número de alternativas de respuestas, a pesar de que aumentará el 
número de errores, disminuimos la posibilidad de que aparezca una pauta escalable 
cuando de hecho el universo no lo es. 


C) La técnica de la escala discriminatoria de Edwards y Kilpatrick 


La selección de los ítems iniciales para una escala Guttman ha sido siempre un misterio. 
En su primer libro Guttman afirma que la selección es cuestión de intuición. Pero ¿cómo 
opera esta intuición? ¿No existen reglas o hechos que puedan ser usados cuando se 
seleccionan los ítems escalables? Aparentemente la intuición de Guttman opera 
satisfactoriamente porque muchas escalas que han usado esta “técnica” terminan por ser 
perfectamente escalables. Y aun en las publicaciones más tardías la vía de la intuición 
parece ser la más correcta. 

51 nosotros recapitulamos el proceso total para el investigador, vemos que él, 
inicialmente, tiene un número de afirmaciones que más o menos miden adecuadamente 
la variable. De éstas seleccionará un pequeño número al cual aplicará el análisis de 
escalograma o tal vez la técnica H. Nada indica en la técnica de Guttman que los ítems 
deben ser elegidos de manera que representen diferentes pasos en el continuo 
psicológico. Como una cuestión de hecho, todos podrían tener una posición, digamos de 
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7 en un continuo tipo Thurstone. El único criterio es que los ítems sean escalables de 
acuerdo con los efectos discriminativos entre un grupo alto y un grupo bajo. 

Para superar esto, se distribuyen representativamente los ítems a lo largo del continuo 
psicológico, y para establecer algunas reglas para la selección de los ítems iniciales de 
una escala Guttman, Edwards y Kilpatrick desarrollaron una técnica llamada: técnica de 
la escala discriminatoria (the scale discrimination technique). 

Los principales pasos en el procedimiento podrían ser expuestos de la siguiente 
manera: 

1) Por medio de la técnica de Thurstone de los intervalos aparentemente iguales (the 
Thurstone equal appearing interval-technique), un gran número de ítems son colocados 
a lo largo del continuo. 

2) Se calcula para cada ítem la posición mediana y los valores Q. 

3) Para disminuir el número de ítems se seleccionan aquellos que en los diferentes 
intervalos de la escala tienen valores bajos de Q; para esto deben colocar todos los ítems 
en una figura como la siguiente: 


3 No deben ser usados 
pen ©“ е RA 
ра рс ра С > o р р А >” 
Valores О A уез z LE Аааа > к ЮН... EE A 
| е “охх 
ере D 04 эе Para ser utilizados 
ale > әс 


Se coloca el cutting point como indica la línea (mediana de la escala Q) y se 
incluyen aquellos ítems que tienen valores bajos de Q; los que tienen valores altos se 
excluyen. 

4) Ahora se vuelcan los ítems que quedan en una escala Likert, adicionando 5 o 6 
alternativas de respuesta para cada uno. 

3) Se aplica la nueva escala a por lo menos 100 jueces, y se separan el grupo alto (Q) 
y el grupo bajo (Q1), de acuerdo con los puntajes totales. 

6) Para probar el poder discriminativo de los ítems se dicotomizan los pesos como en 
el siguiente ejemplo: 
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Grupo bajo Grupo alto 


p a AA 

5 2 + | 

(4) | 8а 3d | 
(3) | 7 | l - 
a а ———— 7 
ї ЕЕЕ 
(0) | Аш | de | 
| | | 


La idea es seleccionar el cutting point en el continuo de los pesos con el fin de 
minimizar la suma entre las celdas a y d. Si colocamos el cutting point entre (3) y (4) 
nosotros tendríamos el siguiente resultado: 


en donde la suma mínima sería a — d = 31. Si elegimos el cutting point entre (2) y (1) la 
suma mínima sería igual a 49 y, finalmente, si lo elegimos entre (3) y (2) encontraremos 
que la suma mínima es 25. Entonces seleccionamos esta alternativa como la mejor. 

7) Después que se ha hecho la selección de las combinaciones mínimas para todos los 
ítems, se aplica un test гу, a todos los ítems para seleccionar aquellos que tengan un alto 
poder discriminatorio. La fórmula a utilizar es la siguiente: 


bc — ad 


a = 
i v (a + b) (b +d) (a+c) (c + d) 


donde a, b, c y d se refieren a las siguientes celdas: 


214 


Grupo bajo Grupo alto Total 


Total a+c b+d 


Las figuras que aparecen más arriba reciben el siguiente valor гу, 


n= 67:79) (078) _ 73 


Г \// (104) (95) (96) (87) 


que es un valor aceptable. 

8) Ahora que se tienen los valores para todos los ítems se colocan todos los ítems en 
un diagrama para elegir los que tengan valores más altos de rọ. El procedimiento es el 
mismo que se indicó para el punto 3. 


> 


< омми 
e e A D 
1.0 e e y Seleccione estos valores 


0.0 


Debe notarse que todo el tiempo tratamos de mantener el continuo psicológico 
subyacente intocable (manteniendo la distribución de los ítems sobre la escala de Іа 11 
más o menos homogénea). 
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CUADRO 12 


Мә мә мә лм ww O N не н O e mn yy in Дь но y) н Y Y КӘ AA му) нә 
Le кє ууз ло уо WO н С Ф Фф Ф ло ФО dh го һм мә һә М мә Һә wr 
ФФ Ф ло 4 ло мм A eee Кә 4 мә 
+ оз мз -h ww Y. O. з we. din о 
-A -A u ьм О р о мә td wd wc. мо 
OANA ha ьм ло ьо hd e e e e y de e e 
AAND ARONA 


1 
3 
4 
2 
1 
3 
3 
1 
3 
4 
0 
4 
j 
4 
3 
1 
0 
3 
3 
2 
2 
3 
3 
1 
3 


+ A u u -h Yeh М нә нә Д y Le OA a de Y www << Qe н 
Y -A e de uw мә -A e КӘ ке ә ДЬ нә ДЬ O 4 9 ке мә uy ҺӘ кә «Qu je 


D) La técnica H para mejorar la escalabilidad de la escala Guttman 


Para mejorar la escalabilidad de la escala Guttman se puede utilizar la técnica H. La idea 
es formar por medio de esta técnica nuevos ítems (contrived items) agrupados con 
algunos de los ítems iniciales. 

Supongamos que tenemos los datos que aparecen en el cuadro 12 (p. 192). 

Es decir, 25 individuos han respondido a 10 ítems. Nosotros queremos aumentar la 
escalabilidad formando contrived items. 

1) Existen cinco categorías de respuestas para cada ítem arbitrariamente numeradas 0, 
1,2,3,4. 

2) Para cada persona se computa un puntaje total basado en todos los ítems que serán 
sometidos al análisis de escala. 

3) Se obtienen las tablas de correlación de cada uno de los ítems considerados con el 
puntaje total provisorio. Para cada ítem se hacen distintas participaciones, considerando 
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como categorías positivas las respuestas números /, 2, 3 y 4, después la 2, 3 y 4, después 
la 3 y 4 y luego la 4. 
Empezamos por ejemplo con ítem 1, tomando 3 y 4 como positivo: 


Cuapro 13 


Puntaje total 
clasificado 0.1.2 Positivos 3.4 


4) Seleccionamos los cutting points para cada ítem que se correlacionan con el 
puntaje (score) total, los cuales son lo suficientemente altos para formar una tabla de 2 
por 2 en la cual ninguna celda error tiene una frecuencia mayor que la menor frecuencia 
de las dos celdas de la diagonal principal. Es decir, en este caso: 


CUADRO 14 


llegamos a: 
3, 4 


Frecuencia 
Positiva = 12 
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Calculamos el ro: 


bc — ad 12.6 — 5.2 
ГО ИРОНИ a dc 1 


v (ab) (bd) (ac) (cd) /17: 14-11: 8 


Se siguen haciendo los mismos cálculos de го рага el ítem 1, pero ahora agrupando 
las categorías de otra manera. Las otras posibilidades son: 


Positivas 


1,2,3, 4 
2,3,4 

2 3, 4 (menos utilizado) 
¿2,8 4 


3) Ordenamos todos los cutting points de la frecuencia positiva más alta a la más baja. 
Véase cuadro 15. 

6) Seleccionamos conjuntos triples de ítems para constituir los cuatro nuevos 
contrived ítems. El objetivo principal es seleccionar ítems aceptables con la misma 
frecuencia aproximada para cada triple y espaciar cuanto sea posible estos conjuntos de 
triples tan extendidos (cuadro 15). 
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CuaADrO 15 


Categorías 


positivas 
6 
6 
7 
8 
8 
10 
10 
2 
3 
1 
4 
7 
8 
9 
9 
10 
10 + 
» | Contrived 
йет 1 
+ 
Е Contrived 
& ltem П 


Ы | Contrived 


2 
6 
7 
9 
2 
3 
5 
Я 
3 
5 
1 

6 
8 
4 
1 

7 
2 
+ 
5 
3 
5 
1 
+ 


„ | нет Ш 
Н Contrived 
8 Item IV 


Reglas: a) Si es posible, no repetir los ítems iniciales en diferentes contrived items. b) 
Buscar conjuntos de 3 ítems con un máximo de correlación (ro). 

7) Adjudicar puntajes a cada individuo en cada contrived item asignándole un puntaje 
positivo si fue positivo en dos o tres de los ítems componentes del contrived йет. 


CuaADro 16. Contrived items 


Individuos 1 П ПІ Iy 
l zæ 
2 — - - + 
3 + + -> 
4 — — + + 
5 — - - + 
6 - - + + 
7 - + = + 
8 — ~- - + 
9 - — + + 
10 + + + + 
11 — — -- -- 
12 =- + + + 
13 — — — + 
14 + = + + 
15 =- — — — 
16 — — — — 
17 _ — - + 
18 - + = + 
19 а — + = 
20 = + + + 
21 — + + + 
22 Е + = + 
23 = = -- + 
24 - + - + * 
25 o - Е + 
* Мо escalable 
CR = .96 
MMR = .76 


Entonces hemos llegado a 4 nuevos ítems (contrived items) que muestran un mayor 
coeficiente de reproductividad y una mayor diferencia entre CR y MMR. 


E) La versión final de la escala 
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Hemos analizado el conjunto total de ítems, llegando finalmente a 10 ítems escalables 
según los criterios de la escala Guttman. Reproducimos aquí 4 de ellos y la manera de 
presentarlos en un cuestionario (en el ejemplo que citamos los 10 ítems han sido 


escalables para 5 valores en las alternativas de respuestas). 


1. El patriotismo y la lealtad 
son los requisitos primeros y 
más importantes que debe lle- 
nar todo buen ciudadano. 


Ud. está: 


. Quien по quiere pelear por 
su país merece algo mucho 
peor que la cárcel o los tra- 
bajos forzados. 


Оа, está: 


. Cualquier esfuerzo hecho en 
el entrenamiento militar de 
Chile es compensado por los 
beneficios de su seguridad. 


Ud. está: 


Para Chile sería un grave 
error permitir el ingreso de 
los extranjeros que quitan las 
oportunidades de trabajo a 
los nacionales. 


Ud. está: 


Totalmente de acuerdo, 

De acuerdo en general, 

Ni de acuerdo ni en desacuerdo. 
En desacuerdo en general. 
Totalmente en desacuerdo. 


Totalmente de acuerdo. 

De acuerdo en general, 

Ni de acuerdo ni en desacuerdo. 
En desacuerdo en general, 
Totalmente en desacuerdo, 


Totalmente de acuerdo. 

De acuerdo en general, 

Ni de acuerdo ni en desacuerdo, 
En desacuerdo en general, 
Totalmente en desacuerdo, 


Totalmente de acuerdo, 

De acuerdo en general. 

Ni de acuerdo ni en desacuerdo. 
En desacuerdo en general. 
Totalmente en desacuerdo. 


La escala es unidimensional, es decir que los resultados obtenidos de los sujetos van a 
permitir ubicarlos en el continuo favorable-desfavorable a la actitud, en un rango que va 
(en nuestro ejemplo) de 0 a 40 puntos. 


Е) Ventajas y desventajas de la escala Guttman 


Ventajas. a) Se asegura en forma casi definitiva la unidimensionabilidad de la escala. b) 
Conociendo el puntaje de un individuo se puede saber qué grado de acuerdo tuvo con los 
ítems y ubicarlo así en el continuo de la escala. 

Desventajas. a) Cuando se trata de medir actitudes complejas conviene hacer un tipo 
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de escala рага cada dimensión de la actitud. b) Involucra mayor cantidad de trabajo que 
en las dos escalas mencionadas anteriormente (Lickert y Thurstone). c) Escalas de este 
tipo pueden resultar unidimensionales para un grupo y no para otros grupos. 


G) Comentarios finales 


Los items de la escala Guttman, como los de la escala Lickert, son acumulativos. Sin 
embargo, los ítems en la escala Lickert son, cada uno de ellos, acumulativos; mientras 
que en la escala Guttman consiste en una serie acumulativa de ítems, donde cada ítem 
tiene además carácter de acumulativo. De ahí que en la escala Lickert sea posible que 
todos los ítems puedan ocupar aproximadamente el mismo lugar de la escala; en el caso 
de la escala Guttman, utilizando la técnica H de Edwards y Kilpatrick, garantizamos que 
los ítems en la escala se distribuyan a lo largo del continuo de actitud. En términos 
gráficos: 


Frcura $ 


porcentaje de respuestas “si” 


0% 


4-——— negativo a la variable positivo а la variable ———> 


Ejemplo de algunos ítems acumulativos que forman una serie acumulativa de ítems. Todos los ítems van en la 
misma dirección (todos los ítems son de tal tipo que todos los sujetos con una disposición negativa respondan 


Sí”). En realidad la inclinación para cada ítem y las distancias entre los ítems varían. 


¿Variación en el instrumento, en los sujetos, o en ambos? 


La escala Guttman ordena tanto los sujetos como los estímulos con respecto a un 
continuo de actitud, es decir que tanto a sujetos como a estímulos se les puede asignar 
valores de escala. Consecuentemente, la escala Guttman corresponde a un enfoque 
centrado en la respuesta. En este caso, tanto la actitud del sujeto como la actitud 
reflejada por el estímulo actúan para determinar la respuesta del individuo. 


MÉTODO DE COMPARACIÓN POR PARES 


Consiste en presentar los estímulos al sujeto de a dos por vez (pares) y preguntarle cuál 

de ellos es el más grande, el mejor, el más cálido, etc. Por medio de este artificio 

logramos un orden de rango basado en el número de elecciones recibidas por cada ítem. 
Como las comparaciones son sistemáticas (el sujeto compara todo estímulo con cada 
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uno de los otros), el resultado final nos indicará cuán consecuente es el individuo con sus 
juicios о evaluaciones. En otras palabras, esto nos da la consistencia de las respuestas o 
la confiabilidad. En una pauta totalmente consistente, debemos esperar que el estímulo 
que sea más grande, más agradable, más cálido, etc., para el sujeto tendrá n — 1 
elecciones, el segundo estímulo n — 2 elecciones, y así sucesivamente hasta llegar al 
menos grande, que tendrá 0 elecciones. 

Se debe tener cuidado con no presentar sistemáticamente un estímulo en primer o 
segundo lugar, ya que con ello podríamos favorecer o contrariar la elección. Para evitar 
esto, se colocan los estímulos aleatoriamente, o se administran formas paralelas. 

Este método de comparación por pares requiere mucho tiempo cuando las 
comparaciones a realizar son numerosas. El número posible de pares a calcular resulta de 
la fórmula 


п (п – 1) 
2 


donde n = cantidad de ítems. 

Es decir que si queremos comparar 50 ítems, el número de combinaciones que el 
sujeto deberá evaluar son: 1225; si utilizamos 100 ítems, el número de pares a comparar 
serán 4950. 


A) Ejemplo de construcción de una escala basada en el método de comparación por 
pares 


El método de comparación por pares puede ser usado como un test de Tipo A, o como un 
test de Tipo B. Analizaremos aquí los resultados de un test de Tipo B en el caso de los 
jueces y un test de Tipo A en la aplicación a un sujeto. 


1) Versión de los jueces. Test de Tipo B 


Supongamos que queremos determinar el grado relativo de izquierdismo-derechismo de 
5 partidos políticos en un país cualquiera, para después poder ordenar el grado de 
1zquierdismo-derechismo en sujetos según sus simpatías políticas por partidos. 

En la versión de los jueces vamos a ubicar a los partidos en un orden de rangos, y 
además —según la evaluación de los jueces— en una escala intervalar en donde un 
extremo de la escala representará izquierdismo y el otro derechismo. 

A un grupo de 50 jueces solicitamos que ordenen los 5 partidos 4, B, C, D y E dando 
un valor 0 al partido más a la izquierda, un valor 1 al siguiente, etc., hasta un valor 4 al 
partido ubicado más a la derecha del espectro político. 

Analizaremos los resultados de 5 jueces (se entiende que la evaluación de la escala 
debe hacerse sobre el total de jueces que se utilicen) para simplificar las operaciones. 
Los resultados de los ordenamientos de nuestros 5 jueces son los siguientes: 
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Juez Ordenación de los partidos 


с> 00 Nm 

о Ф юш њ > 
Ф № Ф м оо С) 
һ оо оо > м y 
„о Y 
ооо о 


с 


El puntaje máximo posible con 5 jueces para un partido es F=4 El 


puntaje mínimo es 0. 
Los puntajes para los cinco partidos son entonces: 


A=(4+3+2+4+3)/5=3.2 


C=15/5=3.0 
B=14/5=2.8 
D=4/5 =08 
E=1/5 =02 


El orden de rango de los partidos, de derecha a izquierda, es: 
A — C — B — D — Е, y su ubicación en una escala intervalar: 


ADA RA 


2) Versión de la escala para sujetos. Versión final. Test de Tipo A 


En el cuestionario se presentan los partidos políticos por pares, en una lista en la que se 
combinen de dos en dos todos los partidos. En nuestro caso los pares a comparar serían: 


A-B B-D 
AC B-E 
A-D CD 
A-E C-E 
B-C D-E 


Cuidamos, por supuesto, que los partidos aparezcan “mezclados” en la lista, evitando 
por ejemplo que el partido A esté siempre al comienzo, y se le solicita al sujeto que 
seleccione entre cada par a cuál de los dos partidos prefiere. 


B) Ejemplo de una escala de comparaciones por pares en un cuestionario (entrevista) 


224 


El entrevistador muestra una tarjetita (hoja Ш) separada con el contenido indicado 
con la línea — — — — arriba. En el cuestionario aparece el texto total arriba. El 
entrevistador sigue las instrucciones preguntando cada vez por un solo par. 

Las indicaciones se hacen naturalmente en el espacio en el cuestionario y no en la 
tarjeta (hoja Ш). (El entrevistador hace el registro en el cuestionario señalando el 
entrevistado solamente su preferencia.) 

Un entrevistado ha contestado de la siguiente manera: 


35, Tengo aquí una hoja соп los nombres de los partidos políticos, agrupados 
de dos en dos. Por favor, digame cuál partido prefiere en cada grupo 


Muestre hoja Ш 


Subraye el partido escogido, si dos par- Conservador ~ Liberal 
tidos son escogidos al mismo tiempo, Socialista — Comunista 
subraye ambos Si el entrevistado no Liberal — Partido Laborista 
puede escoger ningún partido, no sub- Laborista_- Socialista 
raye nada Labcrista ~ Conservador 

Comunista — Laborista 
Conservador — Socialista 
Liberal — Comunista 
Socialista — Liberal 
„Comunista. Conservador 


Conserv. 1 

Lib. 24+2+2+2 
Cent. 2+2 +1 
Soc. 2+ 2 

Com. 2 


HENAN 


Las ponderaciones son calculadas después por el entrevistador. Se pone 2 si una de 
las alternativas fue tomada, y 1 si ambas fueron tomadas. El resultado es el perfil 1, 8, 6, 
4, 1 del sujeto. Podemos concluir que la persona simpatiza más con el partido liberal. La 
ponderación 2 y 1 que corresponden a cada par es arbitraria. Se puede utilizar, por 
ejemplo, también 1 y 0. En este caso el perfil sería 0, 4, 3, 2, 0, y el sujeto todavía 
simpatiza más con los liberales. 

Además de poder determinar la posición del sujeto en el continuum izquierda- 
derecha, se puede, por ejemplo, estudiar las personas que tienen inconsistencia en sus 
perfiles. Además del perfil obtenido podemos calcular la posición del individuo según 
nuestra escala: 
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Resultados para el individuo 


Posición del par- н , Columna М Posición del indi- 
tido a lo largo de di Núm, de eleccio- viduo a lo largo 
la variable Р nes “recibidas” de la variable 
++ 4 A 1 4 por l= 4 
+ 3 е 8 3 рог 8 = 24 
2 B 5 2 por 5=10 
— 1 D 4 l por 4= 4 
—— 0 E 2 0 por 2= 0 
Total = 42 


El individuo tiene una posición medianamente en el centro de la escala. Una persona 
extrema en la variable recibe como máximo 60 puntos y como mínimo 20. Compruebe 
esto usted mismo a través de cálculos. 

Es evidente que resulta mucho más fácil para el sujeto indicar cuál de las 2 
alternativas prefiere más. Sopesar cada ítem en una escala es más difícil, como también 
es complicada la tarea de ordenar por rango los ítems. Cuando el número de ítems es 
más de 3 o 4 en la tarea de ordenar por rango, el sujeto mismo tiene que usar alguna 
especie de comparación de los ítems entre sí. De este modo el método de comparaciones 
por pares se hace en una forma sistemática. El resultado de este método es un orden de 
rango basado еп el número de elecciones recibidas por cada ítem. 

Una ventaja con el método de comparaciones por pares es que muestra cuán 
“consecuente” es el sujeto en su estimación de las alternativas comparadas. Una 
inconsecuencia se muestra al disminuir irregularmente la serie de números en la columna 
М. Si el número de ítems es N y si el sujeto es consecuente, nosotros obtendremos (N — 
1) elecciones recibidas para el ítem que al sujeto le gusta más, (№ — 2) para su segunda 
preferencia de ítem, etc. Si el número de ítems es 7, así recibimos 6, 5, 4, 3, 2, 1, 0 (en el 
caso de la persona mencionada anteriormente). 6, 5, 4, 2, 2, 2, es un ejemplo de 
inconsecuencia. La suma de los valores de la serie de números es en ambos casos 21, el 
número de comparaciones por pares. 

Hay algunas variantes del método de comparaciones por pares, como el método de 
comparaciones por pares dobles y comparaciones tríadas que han sido usadas en 
medición de intereses y actitudes. Estos métodos, sin embargo, hacen más difícil que el 
sujeto haga una ordenación “consecuente” (precisión más baja). 

Algunos test de interés y actitudes muy conocidos que usan el método de orden por 
rango o el método de comparaciones por pares son: el test de interés de Allport Vernon, 
Lindzey en “Study of Values” (actitudes hacia la religión, política, arte, ciencia, etc.) y el 
registro de preferencia Kuder (interés en actividades como deporte, música, etcétera). 


C) Ventajas y desventajas 
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Ventajas. a) Proporciona resultados más precisos b) Muestra claramente cuán 
“consecuente” es un sujeto con sus propios juicios. c) Es más fácil para un sujeto indicar 
cuál de dos alternativas prefiere más. 

Desventajas. a) Cuando los juicios son numerosos, las comparaciones son muy 
grandes. En el caso de 20 ítems, el número de comparaciones a realizar es de 190. b) 
Gran consumo de tiempo de entrevista. 


EL DIFERENCIAL SEMÁNTICO. LA ESCALA DE OSGOOD 


A) Antecedentes teóricos 


El método es descrito por los autores como un método para medir el significado que 
tiene un objeto para un individuo. 

Osgood supone que existe un espacio semántico de dimensionalidad desconocida y de 
naturaleza geométrica. El espacio está construido (o constituido) de escalas semánticas. 
Cada escala consista de un par de adjetivos que son bipolares. Se supone que estas 
escalas forman una función lineal que pasa a través del origen. Para estar en condiciones 
de definir el espacio adecuadamente, es necesario usar una gran cantidad de escalas que 
son una muestra representativa extraída del universo de escalas. Para diferenciar el 
significado de un objeto, el individuo hace una elección entre las alternativas dadas. La 
función de cada elección es localizar el objeto en el espacio semántico. La validez de la 
localización en este punto en el espacio depende del número y representatividad de las 
escalas. 

De este modo, la diferencia semántica significa la estabilización sucesiva (anclaje) de 
un objeto hasta un punto en el espacio multidimensional semántico, a través del puntaje 
de un número de alternativas semánticas dadas presentadas en la forma de escalas. Una 
diferencia de significado entre 2 objetos es simplemente una función de las diferencias 
de su ubicación en el mismo espacio, es decir, una función de la distancia 
multidimensional entre 2 puntos. 

El punto en el espacio que da una definición operacional del significado tiene 2 
características principales: 7) Dirección desde el origen; 2) Distancia desde el origen. 
Esto podría ser explicado como el tipo e intensidad del significado. 

La dirección desde el origen depende de cuál de los polos de la escala se elige y la 
distancia depende de cuán extrema es la posición elegida en la escala. 


B) Dimensiones en el espacio semántico 


Osgood dio gran importancia al muestreo. El diferencial semántico está influido por 3 
fuentes de variación: el individuo, las escalas y los objetos. Muchas diferentes 
modificaciones fueron hechas para asegurar la universalidad de la estructura del factor 
(factor-structure) pero siempre Osgood obtuvo los mismos factores principales en los 
diferentes análisis y así llegó a la conclusión de que la estructura del factor no dependía 
de la elección de escalas. El seguir 3 factores de hecho explicó la mayor parte de la 


227 


varianza total, mientras otras dimensiones sólo explicaban una pequeña parte de ellas. 


Dimensiones 


1) La evaluación que hace el individuo del objeto o concepto que se está clasificando. 
Ejemplo de escalas bipolares: regular-irregular; limpio-sucio; bueno-malo; valioso- 
despreciable. 

2) La percepción del individuo de la potencia o poder del objeto o concepto. Escalas: 
erande-chico; fuerte-débil; pesado-liviano. 

3) La percepción del individuo de la actividad del objeto o concepto. Escalas: activo- 
pasivo; rápido-lento; frio-caliente. 


C) Construcción 


El método para el diferencial semántico no es una prueba con ciertos ítems y puntajes de 
tests específicos. Debe ser visto como un método para reunir cierto tipo de información 
(un método que puede ser generalizado), el cual tiene que constituirse por las demandas 
que presenta cierto problema de investigación. No hay objetos estándar o escalas 
estándar. 

Selección del objeto (concepto): “objeto” se usa para determinar qué significa el 
“estímulo” que da “reacción” (respuesta) en el individuo a través de su indicación en las 
escalas de adjetivos. 

El objeto puede ser verbal; puede constar de sólo una palabra o de varias palabras. 
Objetos no-verbales pueden ser diferenciados (cuadros u otros estímulos estéticos). 

La elección correcta de un objeto es un problema de muestreo. Esto generalmente 
significa en la práctica común que el investigador usa su sentido común al seleccionar el 
objeto. El investigador debería pensar en elegir objetos: /) Que se supone darán 
diferencias individuales (para poder estudiar la variación en el material). 2) Que tengan 
un solo significado (de otra manera hay riesgo de vacilación en la elección). 3) Que se 
supone que todos los individuos conocen bien (de otro modo habrá regresión al medio de 
la escala). 


D) Selección de escalas 


Al seleccionar las escalas se debe estar seguro de tener los 3 factores: evaluación, 
potencia y actividad representadas. Para cada factor uno puede seleccionar cierta 
cantidad de escalas correlacionadas y a través de éstas obtener el promedio de las 
escalas. Esto aumentará la representatividad y la confiabilidad. Los promedios son 
llamados factor scores. El criterio más importante para la selección de escalas así es su 
patrón factorial (generalmente se seleccionan 3 escalas para cada factor. Las escalas 
elegidas cargadas en ese factor son bajas en los otros). 

Otro criterio es la relevancia de las escalas al objeto. Las escalas con composición 
factorial desconocida pueden ser usadas si se suponen muy relevantes para la 
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investigación. En este caso uno puede incluir escalas con composición factorial conocida 
y usarlas como escalas de referencia y estudiar cómo las escalas “desconocidas” co- 
varían con las escalas de referencia. 


Análisis de los datos 


Se deberán asignar pesos a las diferentes alternativas de la escala: 1, 2, 3, 4, 5, 6, 7; 07, 
6, 5, 4, 3, 2, 1, dependiendo de cuál polo en el par de adjetivos debe ser considerado 
como alto para este factor. 


Por ejemplo: 


bueno malo о bueno malo 


dependiendo del orden de presentación. Las escalas dentro del mismo factor se presentan 
como variable positiva y negativa como en la escala Lickert. Usando los pesos es posible 
hacer cálculos aritméticos corrientes, perfiles, análisis factorial, etcétera. 


E) El test de Osgood y la medición de actitudes 


Tal como se ha hecho notar, el test de Osgood no es una escala de actitudes en el sentido 
corriente, sino que las investigaciones han demostrado que los valores de escala pueden 
ser usados para la medición de actitudes. Se mide la actitud general pero no el contenido 
de la actitud en el significado denotativo. 

Osgood piensa que con la ayuda de los valores de escala es posible formar una escala 
universal que podría ser usada para medir la actitud hacia cualquier objeto. La ventaja 
con tal escala universal sería: /) Económica (tiempo, dinero, trabajo). 2) Disponible y así 
hacer posible la medición de actitudes que no habían sido previstas. 3) Posibilidades de 
comparar entre diferentes investigaciones de actitud y actitud hacia diferentes objetos. 

A continuación presentamos un ejemplo: 


INSTRUCCIONES 


Le presentamos algunos párrafos tomados de periódicos y revistas que indican una 
relación entre diferentes asuntos de interés. Su tarea consistirá en evaluar dichos párrafos 
de acuerdo a una serie de escalas de adjetivos que encontrará a continuación del texto 
que usted debe juzgar. 

El procedimiento consiste en señalar con una X en la escala el lugar en el cual usted 
ubicaría su opinión acerca del texto. 

Por ejemplo: La palabra fanático podría ser evaluada en las siguientes escalas: 
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flexible __: - * - - : __ rígido 


negativo positivo 


delicado РЕ e el cl ЗИНИН TA 
Si alguien considerara que la palabra fanático indica rigidez, debería marcar en la escala 
el lugar que está más próximo al adjetivo rígido, de este modo: 


flexible : - - - - - rígido 
Si considerara que indica rigidez pero en menor grado, marcaría en: 


flexible _: е ў - - X. __ rígido 


o en cualquier otro lugar menos cercano al adjetivo rígido, según lo considerara. Lo 
mismo haría con cada una de las otras escalas. Haga usted lo mismo con cada uno de los 
textos. 
Recuerde que debe señalar su opinión. No deje de hacerlo en ninguna de las escalas. 
Si tiene preguntas formúlelas antes de comenzar a trabajar. Es conveniente que 
trabaje en silencio y lo más rápidamente posible. 


Porque obviamente se ve que una América Latina desarmada espiritual y materialmente 
ante la amenaza creciente y reciente de la Conferencia Tricontinental quedará atada de 
pies y manos para la invasión, la subversión y el consiguiente desembarco de infantería 
de marina en la lucha anticomunista posterior, inmediata e inevitable. 


bueno ж е а а ше а Жа 

débil E A E A A Ича 
о 2% A A A A 
ШН LES ETE O 
blando HE PUE A A РОН =) 
pasivo sa ран р рали шс „ыг IO 
PU DL A TA e "ерл 
A. E BA Far impotente 
frío н ES _ : : : ___ cálido 


La mísera situación social de la minoría negra, que vive hacinada en casas de madera de 
los barrios extremos, ha rebelado una vez más a la gente de color que constantemente 


230 


lucha por mejorar sus condiciones de vida. 

Frente a los aparatos de refrigeración, el aire acondicionado, la vivienda sana y 
cómoda de los blancos, los negros sólo disponen de las bocas de riego para refrescarse 
del espantoso calor de los últimos días. La policía no atendió razones y cerró las bocas 
de riego, pero los negros enfurecidos atacaron a los intrusos y esto dio origen a una más 
de las tantas tragedias raciales que se producen en los Estados Unidos. 


bueno „е с сй ы A A 

débil А A A A A O A эше 
хайыш A A moderado 
o E E A A Пеано 
blando ОНЕ O ДОР. ДАШТ. o OR 
pasivo „= o A A A a au aO 
PO ooe Д7 A E A зы с negativo 
POCO PA E A A O impotente 
frío ~ - : z - - cálido 


El mercado bursátil 


Poca actividad y precios irregulares mostró durante las operaciones de ayer el mercado 
bursátil. Los mejores conformes pertenecieron a Banco de Chile, Tierra del Fuego, 
Copec, Melón, Papeles y Cartones, Cap. y Mademsa. 

Los bonos se anotaron en pequeñas partidas de Deuda Interna 7-1 y Banco 
Hipotecario de Chile 10-6 con cotizaciones mantenidas. 

El volumen de los negocios ascendió a la suma de Е° 331 nominales en bonos y 
279.582 acciones. 

El movimiento en transacciones se vio poco activo siendo inferior al de la semana 
próxima pasada. 

A la hora del cierre de las operaciones, la plaza mostraba poca actividad y precios 
irregulares. 
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bueno е ° Н : z è malo 


débil DOR эй PU 30. S A Шише 
exaltado -a a 2 1 2 2 moderado 
БОМИ T pet A II A naNO 
blando ОИСЕ A A A A A 
pasivo A A A E ci O 
PO A A E A „ыс negativo 
POCEO A A A и К impotente 
frío * ‹ : > - - cálido 


ESCALA DE DISTANCIA SOCIAL DE BOGARDUS 


Para finalizar nuestro capítulo sobre escalas, presentaremos la escala de distancia social 
de Bogardus, quien de hecho fue el primer científico social en utilizar el concepto de 
escala para la medición de actitudes. La escala de distancia social fue utilizada por 
Bogardus para el estudio de las relaciones —manifestadas en términos de actitudes— 
entre grupos étnicos y nacionales. Ulteriormente la utilización de este tipo de escala se 
ha extendido al estudio de relaciones entre clases sociales, grupos ocupacionales, 
etcétera. 

El concepto de distancia social se refiere al grado de conocimiento o simpatía o 
intimidad que caracterizarían las relaciones entre distintos grupos. Por medio de ella es 
posible medir el grado de “aceptabilidad” que un grupo social cualquiera tiene respecto 
de otro grupo. Los ítems a partir de los cuales se construye la escala están graduados de 
manera tal que van de la aceptación (medida por un grado alto de aceptación de 
relaciones íntimas) al rechazo (medido por la negación a cualquier relación). 


A) Procedimientos básicos para la construcción de una escala 
de distancia social 


1) Defina el continuo —dentro del sentido del concepto de distancia social arriba 
mencionado— en términos que van desde un contacto estrecho, afectuoso e íntimo, 
pasando por la indiferencia, hasta llegar a la antipatía, la hostilidad y el rechazo. 

2) Reúna una serie de ítems de distancia social igualmente espaciados. Tales ítems 
constituyen afirmaciones que se refieren a un gran número de relaciones sociales. 

3) De acuerdo con el método de Thurstone —unas 100 personas que hacen de jueces 
—, las juzgan en términos de grados crecientes de distancia social o de grados crecientes 
de proximidad social. 

4) En el estudio de Bogardus, siete de estos ítems igualmente espaciados, de grados 
crecientes de distancia social según la determinación de los jueces, fueron seleccionados. 
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5) A estos siete ítems se les dan números arbitrarios que van de 1 a 7, 
respectivamente, representando creciente distancia social en esta proporción. 

Debemos aclarar que Bogardus, para la selección de los ítems, muchas veces ha 
empleado su experiencia; es decir que no ha recurrido a jueces para que, de acuerdo a las 
evaluaciones de éstos, sean seleccionados finalmente los ítems considerados adecuados 
para que integren la escala. 

En la práctica, lo que han hecho los investigadores es aplicar directamente la escala 
ya estructurada por Bogardus, consistente en 7 ítems. O, por el contrario, solamente han 
adaptado tales ítems —en sus formulaciones— a las necesidades del estudio. 


B) А continuación presentamos los ítems que ilustran esta escala 
de distancia social 


ESCALA DE DISTANCIA RACIAL 


Instrucciones 


1) Dé su primera reacción ante cada pregunta sin pensarlo demasiado. 

2) Dé sus reacciones a cada raza considerada como un grupo. No dé sus reacciones de 
sentimientos a los mejores o a los peores miembros que usted ha conocido, sino piense 
de acuerdo a la idea que usted tiene de la raza considerada como un todo. 

3) Ponga una cruz debajo de cada raza en tantas de las siete filas como sus 
sentimientos le dicten. 


Categoría (ítem) Judío Negro Indio Blanco Chino Mestizo 
europeo 


k oe cautio å Эйла» Бран алои ШИЙ 
2. Tendría como ami- 

gos regulares wpa ra ars A is аЬ 
3. Trabajaría en una 

GI UU. errar rca AENA EAN AA 
4. Viviría en el mismo 

O Oaa ЫСУЛЫ Шс бб» БЫ сыр 
5. Estaría simplemente 

hablando como a co- 

A a AS A A: AS 
6. Excluiría de mi ve- 

CE. AA A. AAA E 
7. Excluiría de mi país 

ёп у 7. A A зан 


eo...» 


.L..oo....o..  ....... s.s... 


El sujeto es, pues, interrogado para dar sus primeras reacciones de sentimientos y no 
para racionalizar. La suposición es que las primeras reacciones de sentimientos reflejan 
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actitudes mejor que ningún otro, aparte de la conducta en sí en un periodo. 

Aunque la conducta de larga duración es la mejor prueba de las actitudes de una 
persona, la escala de distancia social se ideó para dar predicciones, mientras se espera 
que la conducta de larga duración revele las actitudes. La conducta de un corto periodo 
puede revelar seudoactitudes, no actitudes verdaderas. Puede medir actitudes que son 
“ocultas” para ciertos fines. 

Se supone, en consecuencia, que las primeras reacciones de sentimientos sin 
racionalización son significativas en revelar cómo actuaría una persona si tuviera que 
enfrentarse repentinamente con las situaciones citadas en la escala. 


C) Flexibilidad de la técnica 


Otra indicación de la flexibilidad de esta técnica puede verse en el hecho de que puede 
ser usada no solamente para escalar grupos o valores que son externos al sujeto que hace 
el rating, sino también para escalar a los mismos raters con respecto a la distancia social 
entre ellos y algún grupo. 

Para ello se utiliza un continuum en el sentido de favorabilidad-desfavorabilidad de la 
escala tipo Lickert. Con un ejemplo se ilustrará mejor: 


INSTRUCCIONES 


1) Hablando de los norteamericanos, por favor, ¿podría indicarnos su simpatía o no hacia 
ellos? 

2) Por favor, evalúe a los norteamericanos en esta escala, marcando con una cruz en 
los espacios punteados la afirmación que expresa su sentimiento hacia ellos. 


No les tengo Me son deci- Me son un Decididamente Les tengo un 
ni simpatía didamente poco simpá- me son anti- poco de anti- 
ni antipatía simpáticos ticos páticos patía 


co.o.n....oo.n... — 6... .L.CLOOLAALC. e. ..e. o ы ..—..o.o..o... өэ э э ө э 
co on.poeroon..n..e. e... pe... n..e..e....e зосовзоосооосеосов ы ооозовововоо о о 


Esta forma de escala es recomendable y se presenta primero a los sujetos a quienes se 
les está sometiendo a investigación acerca de sus actitudes. Luego viene la forma 
anteriormente diseñada de la escala. 

La forma ilustrada anteriormente se construye de la misma manera para los demás 
grupos étnicos, o nacionales, hacia quienes los sujetos tienen actitudes que nos interesa 
conocer. 


D) Confiabilidad 


Una escala de distancia social no es fácilmente probada para la determinación de su 
confiabilidad, ya sea por la forma múltiple o por la técnica de la división por mitades 
(split-half). El enfoque test-retest es la medida más efectiva de confiabilidad de tal 
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escala. 


E) Validez 


Para mostrar la validez de la escala se requiere pensamiento cuidadoso. La aplicación del 
método del known-group implicaría hallar grupos conocidos que sean favorables con 
algunos de los tipos étnicos y no favorables con otros. Si las respuestas de estos grupos 
forman el requisito patrón, entonces la validez parecería probable. 

Por otro lado, el uso del método de criterios independientes requeriría que el orden de 
rango formara algún otro rango de aceptabilidad social. Tales indicadores podrían ser el 
orden de rango de deseabilidad como inquilinos en un gran proyecto de construcciones 
de viviendas, de aceptabilidad como miembros de un gremio, etcétera. 


Е) Limitaciones y aplicaciones 


Esta técnica de scaling no está limitada en cuanto a su flexibilidad de aplicación ni por 
su crudeza como medida. Los principales problemas son: /) La suposición de la 
equidistancia entre los puntos de la escala. 2) La suposición de que cada punto está 
necesariamente “más allá” del punto anterior. 3) El hecho de que puede ser probada por 
confiabilidad solamente por el “decir” de la técnica ordinaria del test-retest. Por lo tanto, 
el uso de este método de scaling está limitado generalmente a estudios pilotos o a 
investigaciones que por alguna razón deben ser completados rápidamente y no requieren 
un nivel de precisión muy alto. 


BIBLIOGRAFÍA RECOMENDADA PARA ESCALAS DE MEDICIÓN DE ACTITUDES 


Al lector interesado en profundizar tanto en la teoría como en la técnica de escalas de 
medición de actitudes recomendamos especialmente los siguientes textos: 


Edwards, A., Techniques of Attitude Scale Construction; Appleton-Century-Crofts, 
Nueva York, 1957. 

Torgerson, W., Theory and Methods of Scaling; J. Wiley, Nueva York, 1958. 

Thurstone, L., The Measurement of Attitudes; The University of Chicago Press, Chicago, 
1929. 

Stouffer, S., et al. Studies in Social Psychology in World War П. Measurement and 
Prediction; Princeton University Press, 1950. 

Upshaw, H., “Attitudes Measurement”, en Blalock, H., y Blalock, A.: Methodology in 
Social Research; McGraw-Hill, Nueva York, 1968. 

Selltiz, Jahoda, et al., Research Methods in Social Relations; Holt-Rinehart-Winston, 
Nueva York, 1959. 


Recomendamos también revisar especialmente las siguientes revistas: 
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Sociology and Social Research 

Journal of Applied Psychology 

Journal of Social Psychology 

Journal of Abnormal and Social Psychology 
American Sociological Review 

American Journal of Sociology 
Psychological Bulletin 
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VII. EL TRABAJO DE CAMPO 
INGVAR AHMAN 


SUPONGAMOS que los entrevistadores han sido seleccionados y se ha verificado su 
capacidad para el trabajo en el terreno en el cual va a ser realizado. Supongamos también 
que el investigador cuenta con una central para el trabajo de terreno, desde la cual él 
opera. Esta central tiene servicio telefónico, una gran sala de conferencias y algunas 
salas pequeñas, a las cuales los entrevistadores pueden llevar a los R,! si es que existen 
dificultades para obtener un lugar adecuado para realizar la entrevista en otra parte. En la 
central existen, además, planos de la ciudad, guías telefónicas, mapas de 
comunicaciones, etcétera. 

Algunos días antes de que comience el trabajo en el terreno, los entrevistadores deben 
tener una reunión preliminar, con el objeto de tomar todas las instrucciones necesarias, 
ejercitarse en algunos cuestionarios, formularios, etc. Algunos de los puntos de 
importancia que deben tratarse en estas reuniones preliminares son los siguientes: 


1) Descripción del estudio 


El investigador ofrecerá una descripción metodológica del estudio y explicará algunas 
partes teóricas que hay dentro de él. 


2) Descripción de la muestra 


El investigador dará una explicación acerca de la forma como se ha diseñado la muestra, 
su tipo y qué posibilidades existen para remplazar los individuos que no se encuentren al 
efectuar las entrevistas. 

Los puntos 1 y 2 son meramente informativos para ubicar a los entrevistadores en el 
tipo de estudio, y si el investigador lo considera conveniente, pueden eliminarse. Los 
puntos que vienen a continuación son bien específicos y conviene tomarlos en cuenta. 


3) Cómo ponerse en contacto con los respondentes 


A cada entrevistador debe asignársele un distrito especial, propio. El entrevistador recibe 
un mapa y se le pide que haga un plan para sus contactos, que no ofrezca mucha pérdida 
de tiempo en movilización. De acuerdo con la profesión del R, el entrevistador 
selecciona el tiempo que considera más probable para contactarse con las personas 
elegidas. Es importante que se contacte con el mayor número de R posibles. No siempre 
existe la seguridad de que la persona disponga del tiempo necesario para la entrevista 
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cuando es visitado рог el entrevistador, aunque esté realmente interesado. En este caso, 
el entrevistador deberá fijar un día y hora para la entrevista. Cuando establezca la hora 
para la entrevista, debe considerar el tiempo necesario para movilizarse, de tal modo que 
una entrevista no tenga que hacerse en forma apresurada, debido a que el tiempo para la 
próxima entrevista está demasiado cerca de la anterior. El entrevistador debe tener 
especial cuidado de no dejar nunca de asistir a una entrevista que ha sido previamente 
concertada. Si por algún motivo surgen dificultades imprevistas, el entrevistador debe 
acudir de inmediato a la central de operaciones a pedir cooperación. Cualquier otro 
entrevistador puede hacer la entrevista. En caso negativo, es necesario que el 
entrevistador llame a la persona y trate de concertar una nueva entrevista. 51 el R no 
estuviere en casa al efectuar el contacto, el entrevistador puede dejarle un mensaje (esto 
podría estandarizarse para todos los entrevistadores), manifestando que el entrevistador 
se ha hecho presente y que ha estado buscando al R para fijar una nueva entrevista, en 
una fecha determinada, etc. En todo caso, es necesario que el entrevistador trate de evitar 
el contacto con el R a través del teléfono. Es mucho más fácil rehusar una entrevista por 
medio del teléfono que 51 el entrevistador lo solicita personalmente. De igual modo, no 
es recomendable contactar al R en su trabajo, ya que podría estar muy ocupado y rehusar 
la entrevista por esa causa. 


La presentación 


El entrevistador deberá presentarse a sí mismo al R, diciéndole, por ejemplo: “¿Cómo 
está usted? Mi nombre es... Estoy tratando de efectuar unas entrevistas para un estudio 
que hará la universidad. Este estudio desea conocer la opinión pública en asuntos de 
actualidad muy importantes. Usted ha sido seleccionado en la muestra para efectuarle 
una entrevista y me agradaría hacerle algunas preguntas, como ésta:...” 

Hay ocasiones en que el А se pone suspicaz y desea saber algo más acerca del estudio. 
El entrevistador puede ofrecerle más detalles sobre el estudio en general, y su 
importancia para el progreso de la comunidad, etc. Si el respondente está aún titubeante, 
hay que partir con las preguntas: “¿Por qué no comenzamos con algunas preguntas y así 
usted se da una idea mejor?” 

A veces el R no entiende por qué el entrevistador no escoge otra persona para ser 
entrevistada. Puede que sugiera que en vez de él se entreviste a un hermano suyo, que, 
por ejemplo, está más interesado en eso. Llama a su hermano que está en la habitación 
contigua y que está deseoso de ser entrevistado. La situación se torna difícil. El 
entrevistador tiene que explicar que las personas fueron escogidas previamente al azar y 
que no pueden ser sustituidas. Ese R y nadie más es la persona requerida. En muchos 
casos es muy importante explicar el objetivo del estudio y que sus resultados serán 
publicados y remitidos después al entrevistado. Es importante insistir en que las 
respuestas a las preguntas serán usadas solamente en tablas estadísticas y que la 
entrevista es estrictamente confidencial. Algunas de estas explicaciones conviene 
mencionarlas al final de la entrevista, de acuerdo a la forma como reacciona el R. 
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Еп la presentación, es evidente que el entrevistador debe mostrar sus credenciales que 
lo autorizan para efectuarla. Esto debe hacerse como una regla general, sean o no 
solicitadas por el R. La identificación personal, naturalmente, debe llevarse consigo. El 
entrevistador puede preguntar también al R si ha recibido alguna carta previa 
explicándole el estudio que se va a realizar. Si no la hubiere recibido, puede mostrarle 
una copia extra al R. 

He aquí un ejemplo de una carta previa enviada con motivo de una entrevista: 


INSTITUTO DE INVESTIGACIONES EN EL CAMPO SOCIAL 
UNIVERSIDAD DE ........... 


Junio de 1975 


Estimado señor (a): 
El Departamento de Ciencias Sociales de la Universidad de ..................... está llevando a cabo una encuesta de 
la opinión pública en asuntos actuales de importancia. 

El instituto auspicia muchos tipos de estudio. La presente encuesta es parte del estudio de la participación de la 
comunidad y de los ciudadanos, en toda la zona norte del país. 

En las próximas semanas estaremos entrevistando tanto a hombres como mujeres en la zona norte. Su nombre 
ha sido seleccionado como una de las personas que serán entrevistadas. Las personas han sido elegidas al azar. 

El resultado de todas las entrevistas será publicado en un informe que presentará al Norte como un todo. El 
informe será totalmente estadístico y ninguna persona será identificada. Todas las entrevistas serán tratadas en 
forma estrictamente confidencial. 

Con el objeto de que la muestra sea exacta, no podemos efectuar sustituciones de las personas que han sido 
seleccionadas para las entrevistas. 

Un entrevistador con sus credenciales y correcta identificación, que lo acredita como uno de los entrevistadores 
para este estudio, lo visitará en su casa en las próximas semanas. Estamos seguros de que usted encontrará esta 
visita interesante y útil. 

51 usted tiene algunas preguntas que formularnos o desea información adicional acerca de nuestros estudios, 
nos será muy grato contestar a sus requerimientos. 


Le agradecemos de antemano su gentil atención. 


Atentamente, 
Director del Estudio 


Cuando se trate de la presentación, deben explicarse además al entrevistador los 
aspectos de la entrevista que dicen relación con la cooperación o negativa de parte del R. 
¿Cómo puede el entrevistador ganarse la confianza del entrevistado para realizar la tarea 
en la cual está empeñado? ¿Podemos garantizarle esta confidencialidad? Precisamente 
para esto se utilizará este estudio. ¿Por qué se ha elegido exactamente al R? ¿Cómo 
haremos frente a los diferentes tipos de preguntas que el R frecuentemente hace al 
comienzo de la entrevista o antes? 


Confidencialidad 
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Los entrevistadores han de ser entrenados debidamente acerca de la ética de la entrevista. 
El entrevistador no debe discutir ninguna entrevista con nadie que no pertenezca al 
equipo de investigación. Debe tomarse especial cuidado con el objeto de que los 
entrevistadores no discutan acerca de las entrevistas entre ellos en lugares públicos o 
donde puedan ser escuchados por personas que no pertenecen al equipo de investigación. 

Los entrevistadores no deben mostrar el cuestionario ni lleno ni vacío a ningún otro R 
ni mucho menos a otras personas. El entrevistador firmará un recibo por el número de 
cuestionarios que ha recibido y ese número de cuestionarios deberá coincidir con el 
número de entrevistas que aparecen en la central, después que el trabajo haya terminado. 
Los cuestionarios sin llenar no pueden darse a ninguna persona que no pertenezca al 
equipo de investigación, salvo que cuenten con el visto bueno del investigador jefe. 

¿Qué podemos hacer para obtener un alto grado de ética en el equipo de 
entrevistadores? 

Pagos elevados, tanto de entrevistas efectuadas como también de aquellas que no han 
resultado, pero en las cuales el entrevistador ha hecho contacto con el R. 

Uso de grupos especiales. Si el investigador usa un grupo de estudiantes interesados 
en el área de estudio, la motivación para un buen trabajo será alta. En algunos países 
existen equipos profesionales de entrevistadores que poseen título profesional y hay una 
ética de grupo debidamente establecida. Cualquier intento de hacer un mal trabajo, en 
este caso, significa graves perjuicios para el entrevistador. 

Comprobaciones. El investigador efectuará comprobaciones al azar a los 
entrevistadores. Esto puede hacerse en la forma de un llamado telefónico al R, para saber 
cómo encontró la entrevista y hacerle diversas preguntas: “¿Cómo era el entrevistador? 
¿Adecuado o falto de interés?” El investigador puede incluso efectuar visitas y repetir 
algunas preguntas a algunos de los R y preguntarles acerca de cómo encontraron al 
entrevistador. 

En ambos casos, el investigador preguntará cuánto demoró la entrevista. En el caso en 
que algunas personas no hayan seguido las reglas indicadas, se les excluye de inmediato 
del equipo. 


Informes a la central de entrevistadores 


El procedimiento para los informes a la central debe ser fijado de tal modo que el 
investigador pueda verificar cómo se está efectuando el trabajo en el terreno. La primera 
entrevista en el terreno o las dos primeras deben ser verificadas inmediatamente por el 
investigador. Si hay algunos malos entendidos (incluso aunque el entrevistador haya sido 
entrenado antes en el cuestionario), deben corregirse inmediatamente. Puede ser que 
algunas preguntas en el cuestionario no estén suficientemente claras o que las 
instrucciones de los entrevistadores no sean claras o que el entrevistador no haya 
interpretado correctamente algo. Hay entonces una posibilidad de corregir esto 
inmediatamente sin destruir el estudio. Después de esto, por ejemplo, cada 5 entrevistas 
el entrevistador debe entregarlas al investigador para verificarlas. 
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El examen del contenido debe hacerse cuidadosamente. Si el entrevistador se ha 
saltado algunas preguntas, debe ir nuevamente con el R y obtener los datos que faltan. 
En algunos casos es necesario recordar a los entrevistadores algunas instrucciones y en 
la mayoría de los casos debe recordárseles escribir en una forma legible. 


Instrucciones para la investigación 


En cada trabajo de terreno debe dársele a los entrevistadores un folleto de instrucciones 
especiales acerca del estudio. El contenido de este folleto puede ser el siguiente: 

a) Información general sobre el estudio. 

b) Procedimientos de muestreo utilizados. 

с) Datos sobre la entrevista: i) Plan de obtención de datos para cada entrevistador; її) 
Material con que debe contar; iii) Contacto con las autoridades locales; iv) Entrevistas 
рага la práctica; у) Presentación а los R; vi) Plan de contactos con los R; vii) El contacto 
con la central; viii) Cómo motivar al entrevistado; іх) Confidencialidad del estudio. 

d) Códigos generales utilizados: ¿) Instrucciones para las preguntas. 

Especialmente la parte d debe ser seguida por todos los entrevistadores en las 
reuniones. Si se usa algún código especial como el que hemos sugerido con O, X y Y, 
deberá explicarse en detalle y practicarse. Después de esto, todas las preguntas del 
cuestionario deben ser seguidas con las instrucciones especiales que se han dado para 
ello. 

A continuación, los entrevistadores tomarán varios días para estudiar todo el material 
y volver antes de que comience el estudio para una comprobación de sus conocimientos. 


Verificación en el cuestionario 


El entrevistador deberá ser supervisado con el objeto de comprobar que conoce el 
cuestionario sin ninguna dificultad, y que conoce la instrucción existente para todas las 
preguntas y otras instrucciones generales. En el momento de la entrevista es demasiado 
tarde para empezar a buscar las instrucciones, ya que ésta debe tener cierta fluidez. 

En general, una encuesta significa papeles y más papeles. Cuando el entrevistador 
sale al terreno debe llevar, por ejemplo, un equipo como el siguiente: 5 cuestionarios; 1 
folleto con instrucciones para los entrevistadores; 5 juegos de tarjetas, de 3 tarjetas 
c/uno; 20 tarjetas para R (para identificación del R); 1 plano; credenciales; 3 cartas de 
presentación; 20 hojas especiales para dejar a los R que no se encuentren en la casa. 


La inscripción de los R 


En esta parte del capítulo nos proponemos dar algunas indicaciones de un sistema que 
controle la inscripción o registro de los R antes, durante y después del trabajo en el 
terreno. 

Supongamos que el tamaño de la muestra es de 500 y hemos seleccionado las 500 
personas al azar. Registramos por cada persona: nombre, profesión, edad, estado civil, 
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dirección y número de teléfono, la parte del país en que habita y su nacionalidad. Todos 
estos datos se anotan en una página estándar (por cada individuo se emplea una página). 
En esta página registramos, además, dónde se consideró a este individuo en la muestra. 
(Por ejemplo: provincia del Norte, Libro de Registro, pág. 345, ind. Núm. 56.) 

Supongamos que usamos 25 entrevistadores. Por cada entrevistador anotamos una 
página normal donde se colocan sus R. En este caso, 20 por entrevistador, seleccionados 
de tal manera que vivan bastante cerca uno de otro. En esta hoja dejamos el espacio 
suficiente para registrar qué entrevista ha efectuado el entrevistador, cuáles han faltado y 
por qué y 51 las entrevistas se han entregado después a otros entrevistadores. 

Ahora, para cada individuo hacemos un juego de dos tarjetas (exactamente iguales), 
de tamaño pequeño, de cartulina. En esta tarjeta colocamos el nombre del R, profesión, 
edad, estado civil, nacionalidad, dirección y número telefónico. Además, colocamos el 
nombre y número del entrevistador. 

Esto es, cada entrevistador irá al terreno con 20 tarjetas para R y una copia de cada 
una se guardará en la central de entrevistadores. Llamemos a la tarjeta de los 
entrevistadores Te y a la de la central, Tc. 

En la tarjeta Te, el entrevistador hace una anotación cuando la entrevista está lista y la 
razón, en caso de haber sido imposible efectuarla. 

Tendremos dos tarjeteros para las inscripciones que hemos de manejar. Los 
llamaremos 4 y В. En А colocaremos las entrevistas terminadas y los R que no vamos a 
volver a molestar. En B guardaremos todas las Tc al comienzo y todas las Te, con las 
cuales tenemos que continuar. Usaremos los registros siguientes: 

Al comienzo, cuando partimos al terreno encontramos todas las Tc en el tarjetero B 
bajo el entrevistador al que pertenecen (los números 1-6, etc., son los números de los 
entrevistadores). 

Supongamos que un entrevistador vuelve con una entrevista que ha efectuado. 
Entonces la tarjeta Tc en B se retira de su lugar numerado y se pone con la tarjeta Te bajo 
las letras en 4. Las letras en А se refieren a la inicial del apellido del А, en orden 
alfabético. 

Ahora, supongamos que al entrevistador le ha sido imposible efectuar la entrevista 
durante el curso de tres semanas, porque el R se encuentra fuera de la ciudad. En el caso 
en que proyectemos emplear otro entrevistador en la última oportunidad, tomaremos las 
tarjetas Te y Tc y las colocaremos en el tarjetero B bajo el título “Fuera de la ciudad”. Lo 
mismo podría hacerse en el caso en que alguien esté en el hospital por largo tiempo, 
haya concertado con el entrevistador una nueva entrevista para después o si alguien ha 
rehusado cooperar en la entrevista. En el caso en que la persona haya rehusado, el 
investigador puede tratar de probar otra vez con otro entrevistador. Esto es, todas las 
tarjetas que se encuentran en el espacio superior en el tarjetero B y las tarjetas que vale la 
pena intentar de nuevo. 

Tan pronto como una entrevista esté lista, dijimos que su tarjeta pasa al tarjetero 4. 
Lo mismo se hace en el caso en que se haya desistido de hacer la entrevista. Por ejemplo, 
la persona que no desea cooperar y que ha sido imposible convencerla; algunas personas 
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que se encuentran fuera de la ciudad o fuera del país hasta fines de año; otras que se 
encuentran en el hospital por un tiempo largo, es preferible no seguir con el caso. 
Algunas puede que sea imposible entrevistarlas por otras razones. Puede tratarse de un 
extranjero que vive en el país sin conocer el idioma y que haya sido imposible conseguir 
un intérprete; alguien que puede haber fallecido; personas que se encuentran en prisión, 
etcétera. 

Hay muchas ventajas en el uso de este sistema que a primera vista puede parecer 
complicado. He aquí algunas de ellas: 

En cualquier momento del estudio, el investigador tiene la situación completa del 
trabajo en terreno para una rápida inspección. Puede darse cuenta de inmediato de 
cuántas entrevistas hay hechas y cuántas están todavía por hacerse, con el simple control 
de los tamaños de las tarjetas en la parte de abajo de los tarjeteros А y В. Sabe 
inmediatamente cuántas entrevistas ha efectuado cada entrevistador, con sólo verificar el 
número del entrevistador en el tarjetero B. Puede cambiar a nuevos entrevistadores 
inmediatamente con sólo distribuir las tarjetas que se encuentran en la parte de arriba del 
tarjetero B. En este caso, las tarjetas Te van al nuevo entrevistador y las Tc quedan 
anotadas en el número del nuevo entrevistador. El investigador puede asimismo verificar 
cuántas entrevistas fue imposible efectuar con sólo mirar la parte superior del tarjetero 4 
y compararla con las tarjetas que figuran en la parte baja del mismo tarjetero. De ello 
obtiene, también, el porcentaje de pérdida. 

Aún más útil es el sistema si pensamos cuán fácilmente los “R están perdidos” entre 
diferentes entrevistadores, cuando se usan otros sistemas. Nadie sabe quién tiene un 
determinado R, en el momento en que se necesita conocer el dato, así como otras 
inconsistencias. Con el sistema presentado aquí tenemos asimismo una doble 
comparación de las tarjetas. Esto es, todas las tarjetas que van en el tarjetero 4 o B (parte 
superior) tienen que estar pareadas (Tc+Te). Esto es, ningún entrevistador puede andar 
con algunas tarjetas que están terminadas y ninguna tarjeta Tc puede existir cuando ya 
están terminadas las entrevistas. 

En seguida, el investigador completa las “páginas R” y las “páginas del entrevistador” 
(mencionadas al comienzo), en base a los resultados de los dos tarjeteros. Incluso, si la 
mayor parte del trabajo en el terreno ha sido hecho inmediatamente, habrá un gran lapso 
en el cual las últimas entrevistas han sido efectuadas. En este caso el sistema presentado 
es también muy aconsejable y se adecua de inmediato para cualquier operación que se 
requiera. 
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УШ. ANÁLISIS DE DATOS: EL CONCEPTO DE PROPIEDAD-ESPACIO Y 
LA UTILIZACIÓN DE RAZONES, TASAS, PROPORCIONES Y 
PORCENTAJES 


CARLOS BORSOTTI 


DEsPUÉS de haber considerado los problemas lógicos (conceptualización, formulación de 
hipótesis, clasificación, variables, etc.) y lógico-empíricos (operacionalización de 
variables, niveles de medición, índices, etc.), así como las distintas técnicas de 
recolección de datos y los problemas involucrados en ellas (entrevista, cuestionario, 
codificación, etc.), es el momento de considerar dos grandes unidades temáticas: 4) 
Cómo disponer los datos para decidir si la hipótesis puede ser aceptada o debe ser 


rechazada. B) Cómo manejar los datos matemáticamente para aceptar o rechazar la 


hipótesis. 


A) EL CONCEPTO DE PROPIEDAD-ESPACIO 


El concepto de propiedad-espacio intenta dar una respuesta al primer tema. 

Como es sabido, en sociología es difícil aplicar rigurosamente un diseño 
experimental, constituyendo grupos experimentales y de control estrictamente 
controlados. Pero eso no significa que la lógica subyacente al diseño experimental no sea 
utilizable. 

Siempre que se disponen los datos para decidir acerca de si una hipótesis puede ser 
aceptada o debe ser rechazada, se está siguiendo la lógica de un diseño experimental. Es 
decir, se constituyen grupos que poseen distintos grados de una dimensión (educación 
baja, educación alta; ingreso bajo, ingreso medio, ingreso alto) y se somete a todos los 
grupos a un mismo estímulo (una pregunta o un conjunto de preguntas de un 
cuestionario). Se espera que los distintos grupos constituidos respondan de manera 
distinta al mismo estímulo. Si no responden de manera distinta, significa que los 
distintos grados de la dimensión sobre cuya base se constituyeron los grupos no tienen 
ninguna relevancia con relación al estímulo al que fueron sometidos los grupos. Sobre 
esto se volverá a insistir, ya que es un aspecto fundamental. 

Toda hipótesis relaciona variables propiamente tales entre sí, o variables atributos 
entre sí. Para mayor comodidad llamaremos variables tanto a las variables propiamente 
dichas como a las variables atributos, ya que la diferencia parece centrarse, 
principalmente, en los niveles de medición de ambos tipos. 

Como los niveles de medición son cuatro (nominal, ordinal, interval, de razones o 
proporciones), las posibles combinaciones de niveles de medición tomando dos variables 
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son 10 (nominal-nominal, nominal-ordinal, nominal-interval, nominal-de razones, 
ordinal-ordinal, ordinal-interval, etc.). A partir de esto, debe tenerse presente que el nivel 
de medición resultante de la combinación de dos o más variables siempre es el nivel de 
medición adecuado a la variable de más bajo nivel de medición. Es decir, si se combinan 
una variable nominal con una ordinal y una de razones o proporciones, las operaciones 
estadístico-matemáticas permitidas no pueden ser otras que las permitidas para el nivel 
de medición nominal. 

Todo el tema de la propiedad-espacio está dominado por estos tres temas aludidos: 
hipótesis, diseño experimental y nivel de medición. Existen ciertas consideraciones 
subyacentes sobre probabilidades y estructura latente, a las que en este momento no se 
va a hacer referencia pero que conviene tener presentes. 

Se puede caracterizar la propiedad-espacio como el conjunto de las posiciones que 
pueden tener las unidades en estudio en una variable o en un sistema de dos o más 
variables. Una variable puede tener distinto número de valores posibles. Cada uno de 
ellos es una posición disponible para las unidades en estudio. El conjunto de estas 
posiciones disponibles es la propiedad-espacio en la que se ubicarán las unidades. Es 
conveniente aclarar que las unidades en estudio pueden ser individuos, colectivos de 
individuos y colectivos de colectivos. 


La propiedad-espacio en una variable 


Una variable define un espacio de una sola dimensión y, por lo tanto, puede ser 
representada por una línea, aunque esto no es del todo cierto cuando se analizan las 
variables según su nivel de medición. 

Si la variable es de un nivel de medición nominal o variable atributo, no corresponde, 
en realidad, hablar de una línea, sino de un conjunto de compartimientos separados, 
estancos, alineados, sin que la alineación signifique ninguna clase de supuesto 
jerarquizado entre los compartimientos. Si, por ejemplo, se toma la variable 
nacionalidad, puede suponerse un conjunto de cajas alineadas sin contacto entre sí, en 
cada una de las cuales se ubican las unidades en estudio. 

Si la variable es de un nivel de medición ordinal, se tiene nuevamente un conjunto de 
compartimientos estancos, separados, alineados. Pero aquí el hecho de ubicar una unidad 
en uno de los compartimientos significa acordarle un valor menor, igual o mayor que 
otras unidades. Por eso es que la alineación de los compartimientos debe hacerse según 
el orden de mayor a menor o viceversa. 

Si se considera la variable ordinal grado de escolaridad, por ejemplo, los 
compartimientos deben disponerse según el orden: sin educación, educación primaria, 
educación secundaria, educación universitaria. 

Salvando las diferencias propias de la medición, la propiedad-espacio de las variables 
intervales y de razones pueden considerarse conjuntamente. La cantidad de posiciones 
disponibles para las unidades la da el refinamiento del instrumento con que se procede a 
efectuar la medición. Si se mide con un cronómetro que sólo marca hasta décimas de 
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segundo, el tiempo que demora un individuo en hacer una tarea sólo podrá ser medido 
con una precisión de décimas de segundo, y si la tarea tiene una duración máxima de un 
minuto, las posiciones disponibles para los sujetos puestos a prueba serán 600 (60 
segundos х 10 décimas). Se obtiene así una propiedad-espacio de 600 posiciones. Si el 
cronómetro marca hasta quintos de segundo, la propiedad-espacio resultante para 
efectuar la medición dispondrá de 1200 posiciones. 

Es conveniente recordar que las variables de los niveles más altos de medición 
pueden tratarse como variables de nivel inferior, pero no a la inversa. Una variable de 
razones (ingreso) puede tratarse como variable ordinal, pero una variable ordinal (grado 
de escolaridad) no puede tratarse como de razones. 

Supongamos que se desea poner a prueba la hipótesis: “La disposición de los 
inmigrantes a adquirir la ciudadanía del país de llegada tiende a variar según el país de 
origen”. En la recolección de los datos se ha preguntado a los individuos acerca de su 
nacionalidad de origen. Se obtiene así una amplitud de respuestas que puede referirse a 
todos los países del mundo. Las posiciones disponibles para cada unidad superan el 
número de 100. Por lo tanto, resulta un manejo engorroso de los datos y la posibilidad de 
que en algunas de las posiciones se encuentren menos frecuencias que las necesarias para 
efectuar la manipulación estadístico-matemática, así como el hecho de que carezca de 
relevancia analizar la actitud de los inmigrantes de países que tienen frecuencias muy 
bajas. 

Cuando éste es el caso, puede procederse a una reducción de la propiedad-espacio, 
que es una operación consistente en combinar el número de clases, con el fin de obtener 
un número menor de categorías. 

La reducción es una operación general que puede realizarse de distintas maneras. Una 
de dichas maneras es la simplificación. Simplificar una propiedad-espacio es juntar 
posiciones de una variable ordinal, interval o de razones en un número menor de clases 
ordenadas jerárquicamente, o las posiciones de una variable nominal en un número 
menor de clases, o en una dicotomía. 

En el ejemplo anterior, se procedería a una simplificación de la propiedad-espacio si 
se juntaran todos los países de algún continente, manteniendo aislados a los países que 
merecen una consideración especial. O, a la inversa, se mantuvieran aislados ciertos 
países y se pusiera al resto en una categoría encabezada como “otros países”. 

Para que una simplificación sea correcta, debe atenerse a los siguientes criterios: /) 
Debe tener relevancia teórico-empírica. Es decir, la simplificación no debe conducir a 
perder información que sea importante para la comprobación de la hipótesis. 2) Debe 
atenerse a las reglas de la clasificación. Es decir, la propiedad-espacio resultante debe 
contener posiciones mutuamente excluyentes para cada una de las unidades y 
exhaustivas de toda la variable. 3) Debe proveer de frecuencias suficientes en cada 
posición para las manipulaciones estadístico-matemáticas. 

Como se ha hecho notar anteriormente, lo que es permitido al nivel nominal puede 
hacerse a cualquier otro nivel, siempre que se conserven los mismos criterios. 

Mediante la simplificación, toda propiedad-espacio puede reducirse a dos categorías 
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ordinales o a una dicotomía nominal. Si el asunto se considera atentamente, se ve que 
muchas operaciones de codificación (especialmente con las preguntas abiertas sobre 
salario o sobre edad) no son sino simplificaciones previas al manejo de los datos en 
cuadros estadísticos. 

Supongamos que mediante una pregunta abierta se ha determinado el ingreso de los 
individuos. Se ha tomado la variable ingreso (una variable de razones) y se ha codificado 
en intervalos de amplitud 100, obteniéndose la siguiente distribución: 


Солрко 1 

Ingreso Frecuencia Porcentaje AS 
0-100 7 1.9 — 
101-200 30 7.7 9.6 
201-300 71 18.1 27.7 
301-400 93 23.8 51.5 
401-500 58 14.9 66.4 
501-600 34 8.7 75.1 
601-700 29 7.4 82.5 
701-800 8 2.1 84.6 
801-900 11 2.8 87.4 
901-1000 1 0.3 87.7 
1001-1100 3 0.8 88.5 
1101-1200 — — 88.5 
1201-1300 1 0.3 88.8 
1301-1400 1 0.3 89.1 
1401-1500 — — 89.1 
1501 y más 3 0.8 89.9 
No se aplica 31 8.0 97.9 
NS/NR * 8 2.0 99.9 


è NS=No sabe: si el entrevistado no conoce la respuesta. 
NR = No responde: si el entrevistado no desea contestar la pregunta. 


Esta distribución, ya simplificada en la codificación, todavía proporciona un número 
muy grande de posiciones a las unidades. Es necesario proceder a su simplificación. Para 
ello deben tenerse presentes los criterios antes entregados, pero no sólo éstos. Es decir, si 
la variable en cuestión va a ser analizada por separado, conviene reducirla teniendo en 
cuenta exclusivamente los criterios antes entregados. Pero si la variable va a ser 
introducida junto con otras en un índice, es conveniente simplificarla teniendo en cuenta, 
además de los criterios ya citados, la obtención de una proporción igual de casos en cada 
una de las posiciones resultantes de la simplificación. No es conveniente simplificar una 
variable que será introducida en un índice, por ejemplo, dejando un 10% de las unidades 
en una posición extrema, un 50% en la posición media y el 40% restante en la otra 
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posición extrema. 
En el ejemplo propuesto, si el salario vital mínimo fuera de valor 300, se podría 
intentar la simplificación en base a las siguientes posiciones: 


Hasta un salario vital mínimo ..... 21.1% 
Uno y dos salarios vitales ......... 47.49%, 
Más de 2 salarios vitales .......... 14.89, 


Según el número de unidades con que se cuenta y si se analiza aisladamente la 
variable ingreso, esta simplificación puede ser válida. Pero si la variable va a ser 
introducida en un índice, conviene dejar las posiciones establecidas de la siguiente 
forma: 


Ingreso Dajo (0-300) зене жен 27.7 % 
Ingreso medio (301-500) .......... 38.7 % 
Ingreso alto (501 y más) .......... 23.5 % 


que provee la distribución más igualitaria de las frecuencias en el ejemplo dado. 

Con esta simplificación se tiene la variable de razones ingreso convertida en una 
variable ordinal tricotomizada. Para mayores detalles puede consultarse el capítulo П, en 
la sección correspondiente a índices. 


La propiedad-espacio en un sistema de dos variables 


Un sistema de dos variables define un espacio de dos dimensiones y, por tanto, puede 
representarse por un plano. Si las variables son intervales o de razones, el plano 
resultante puede considerarse como un plano continuo, con todas sus propiedades 
estadístico-matemáticas. Si se conocen los valores de una unidad en cada una de las 
variables, puede determinarse fácilmente cuál es el punto que le corresponde en el plano. 

Pero si las variables son nominales u ordinales, el plano resultante ya no es continuo, 
sino un conjunto ordenado de celdas que representa una combinación de los valores de 
las dos variables. 

Se puede tomar como ejemplo la combinación de las variables sexo-educación y 
edad-ingreso. Los planos definidos serían los de la gráfica 1. 

En cualquier caso (salvo cuando se combinan variables nominales entre sí o 
combinadas con variables de otro nivel de medición), la intersección de las dos variables 
debe producirse en el mismo nivel de ambas variables. No es posible intersectar las 
variables edad-ingreso en el valor máximo de ingreso y en el mínimo de edad. 

El número de posiciones o celdas resultante de combinar dos o más variables 
reconoce dos situaciones distintas: 

1) Cuando las variables tienen, por separado, el mismo número de posiciones, se 


aplica la expresión p”, donde p es el número de posiciones y v es el número de variables. 
Así, si se tienen dos variables dicotomizadas, el número de posiciones definidas es p” = 
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2? = 4; si se tienen dos variables tricotomizadas, el número de posiciones definidas es p” 
=32=9, 


Ѕехо Edad 


[| 


Educación 0 Ingreso 
GRÁFICA 1 


2) Cuando las variables tienen, por separado, distinto número de posiciones, se aplica 
la expresión ру х рз х... х py donde ру es el número de posiciones de la variable 1, p> 
el número de posiciones de la variable 2, etc. Así, de la combinación de tres variables, 
una dicotomizada y las otras dos tricotomizadas, las posiciones resultantes son: ру хр» х 
рз =2 x 3 x 3 = 18 posiciones. 

El número de posiciones que se definen en una propiedad-espacio es importante рага 
estimar el número de unidades necesario para realizar una investigación. En principio 
deben presupuestarse alrededor de 30 unidades por posición. Así, para una propiedad- 
espacio definida por dos variables tricotomizadas, debieran preverse 270 unidades, 
resultantes de la aplicación de la expresión: 


(pr х 30) = 3? х 30 = 9 х 30 = 270 


Es costumbre denominar las posiciones de una propiedad-espacio a partir de la 
posición superior izquierda, procediendo horizontalmente, a saber: 


a b с 
а е { 
g h i 


Supongamos que con el fin de probar la hipótesis I: “Mientras más bajo el nivel 
económico social (NES),? más favorable tenderá a ser la actitud hacia el partido político 
X y viceversa”, se dispone de las siguientes distribuciones: 
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Actitud hacia el partido Х Frecuencia 


Muy favorable 2 100 
Favorable 1 290 
Indiferente 3 580 
Desfavorable 1 030 
Muy desfavorable 1 000 

9 000 

Estrato de NES Frecuencia 

Bajo-bajo 2 200 
Bajo-alto 1 950 
Mediano-bajo 1 700 
Mediano-alto 1 550 
Alto-bajo 850 
Alto-alto 750 

9 000 


Con estas dos variables y sus respectivas posiciones, se tiene definida una propiedad- 
espacio de p; х p posiciones, en este caso: 30 posiciones, que darían un cuadro como el 
siguiente: 


Actitud E” 
Muy favorable 


CUADRO 2 


Desfavorable 


Muy desfavorable 


Conviene hacer notar algunos aspectos: 1) La intersección de las dos variables no ha 
sido hecha en los valores más bajos de ambas variables. Esto es conveniente cuando la 
hipótesis sostiene una relación inversa: mientras más de una variable, menos de la otra. 
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El propósito de efectuar la intersección tal como está еп el cuadro es observar el 
comportamiento de las frecuencias en la diagonal principal (la que atraviesa el cuadro 
desde la posición superior izquierda hasta la posición inferior derecha). 2) El número de 
posiciones es sumamente elevado. 3) La variable que se considera más independiente se 
coloca en la parte superior del cuadro. De ahora en adelante llamaremos x a la variable 
independiente y y a la variable dependiente. 4) Que los totales son iguales a las 
distribuciones de cada variable, como no podía ser de otra manera. Estos totales (tanto 
los del extremo derecho como los del extremo inferior) se denominan “marginales”. En 
el ejemplo, se tienen marginales de x y marginales de y. 

Para proceder a reducir esta propiedad-espacio, se combinan posiciones de ambas 
variables. La variable x se agrupa en una tricotomía con valores bajo, medio y alto; la 
variable y, en una tricotomía con valores favorable, indiferente, desfavorable. La 
propiedad-espacio, así definida, tendrá sólo nueve posiciones y el cuadro resultante será 
el siguiente: 


CUADRO 3 


Actitud 


c+f+k41 
с 


a+b+g+h 
a 


c+d+i+j 
b 


Desfavorable 


100 


2790 


Indiferente 


s+t+y+z 


u+v+a' tb 
h i 


Favorable 


600 1080 


b+e+h 


3250 1600 ) 
КРУК... Жа ОМИРИ. e 


Pero los análisis sociológicos a partir de dos variables sólo proporcionan información 
acerca de la asociación entre ellas, sin hacer un gran aporte de carácter explicativo. Para 
esto es menester agregar por lo menos una tercera variable, para ver si una vez 
introducida ésta, la asociación entre las dos primeras variables se mantiene, se especifica, 
se refuerza o desaparece. 

Antes de considerar la propiedad-espacio resultante de la introducción de una tercera 
variable, es conveniente analizar una especie muy útil de reducción de la propiedad- 
+ Siguiendo соп el ejemplo propuesto, 


espacio, la llamada reducción pragmática. 
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supongamos que se pide poner a prueba la hipótesis П: “La movilidad ascendente tiende 
a hacer menos favorable la actitud hacia el partido político X y viceversa”. Para 
comprobar esta hipótesis, se proporciona una tercera variable: NES del padre de 
individuo-unidad, cuya distribución es la siguiente: 


NES del padre Frecuencias 
Estrato bajo-bajo 2750 
Estrato bajo-alto 2450 
Estrato medio-bajo 1650 
Estrato medio-alto 1350 
Estrato alto-bajo 500 
Estrato alto-alto 300 

Total 9 000 


Si se procede а la reducción de esta variable por el procedimiento de la simplificación, se 
obtiene la siguiente distribución: 


NES del padre Frecuencias 
Estrato bajo 5200 
Estrato medio 3000 
Estrato alto 800 
Total 9 000 
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CUADRO 4 


Al formar la propiedad-espacio correspondiente a las variables NES del hijo y NES del 
padre (2 variables tricotomizadas), quedan definidas 9 posiciones con las frecuencias que 
se observan en el cuadro 4. 

Si se observa atentamente esta propiedad-espacio con 9 posiciones en relación con la 
movilidad social, se ve claramente que en las posiciones ubicadas sobre la diagonal 
principal (celdas a, e, i) se encuentran los individuos inmóviles, es decir, aquellos que 
están en el mismo estrato que su padre. Si se observan las celdas d, g, h, se ve que en 
ellas se encuentran los individuos con movilidad ascendente, es decir, aquellos 
individuos de NES medio con padres de NES bajo y los individuos de NES alto con padre 
de NES medio о bajo. Asimismo, al observar las celdas b, с y f, se obtiene a los 
individuos móviles descendentes, es decir, aquellos individuos que, teniendo padre de 
NES alto o medio, están en NES bajo, y los individuos que, con padre de NES alto, están en 
NES medio. 

De tal modo, es posible efectuar la reducción pragmática de la propiedad-espacio 
original de 9 posiciones a una propiedad-espacio de sólo tres posiciones, a saber: 


9000 


Movilidad Frecuencias Modo de obtenerla 
Descendentes 600 Suma de celdas b4c+f 
Inmóviles 6400 Suma de celdas a + e -+i 
Ascendentes 2000 Suma de celdas 4+2 + А 

Total 9000 
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Debe notarse que еп la reducción pragmática: 

1) Normalmente desaparecen las variables que definían la propiedad-espacio original 
y se obtiene una nueva variable. En el ejemplo, ya no se tiene NES del padre o NES del 
hijo, sino una nueva variable: dirección de la movilidad social. Se ha producido así una 
reducción de la propiedad-espacio, no en virtud de una simplificación del número de 
posiciones de las variables, sino en virtud de una transformación de las dimensiones del 
espacio dado que, de un espacio de dos dimensiones, ha pasado a ser un espacio de una 
dimensión. (Diríase que un plano se ha transformado en una línea.) 

2) La reducción pragmática se justifica en atención al significado teórico de las 
posiciones definidas por la propiedad-espacio original y no por los valores numéricos de 
estas posiciones. (Esto se verá más claramente al considerar la reducción numérica de la 
propiedad-espacio.) 

3) La reducción pragmática es una operación sumamente útil cuando se efectúan 
estudios secuenciales, es decir, cuando se analizan los distintos valores que va teniendo 
una unidad en una misma variable a lo largo del tiempo. Esto permite proceder a la 
reducción pragmática en base a categorías tales como constancia-inconstancia, 
estabilidad-inestabilidad, etc., ya sea el diseño del estudio en un solo tiempo o un diseño 
tipo panel. 

Así, puede decirse que la reducción pragmática es una combinación de las posiciones 
de una propiedad-espacio en busca de significaciones teóricas nuevas, a partir del 
significado teórico de las posiciones y no de sus valores numéricos. 

Retomando el ejemplo, la propiedad-espacio definida por las variables dirección de la 
movilidad y actitud hacia el partido X, necesaria para decidir si la hipótesis puede ser 
aceptada o debe ser rechazada, sería la siguiente: 


CUADRO 5 


| Descendente Inmóvil Ascendente Total 
Actitud 
шее [ш И 


Dirección de 


Debe notarse que los grupos experimentales están definidos por la dirección de su 
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movilidad. La lógica del razonamiento es la siguiente: formados tres grupos distintos 
según la dirección de la movilidad, se somete a todos ellos a un mismo estímulo. Si las 
respuestas al estímulo son distintas en los diferentes grupos y se producen en la dirección 
prevista, la hipótesis puede aceptarse. Si las respuestas al mismo estímulo no muestran 
diferencias en los distintos grupos o la muestran en una dirección no prevista en la 
hipótesis, ésta debe ser rechazada. 


La propiedad-espacio en un sistema de tres variables 


Un sistema de tres variables define un espacio de tres dimensiones y, por tanto, puede 
representarse por un cubo. 

Si las tres variables tienen el mismo número de posiciones, el sistema tendrá tantas 
posiciones como resulten de la aplicación de la expresión p”, antes considerada. 

Si las variables tienen distinto número de posiciones, el sistema tendrá tantas como 
resulten de multiplicar la cantidad de posiciones de todas las variables, aplicando la 
expresión ру х p2 х... х py, que también ya ha sido considerada. 

Mediante un ejemplo y retomando la representación del cubo, se verá más claramente 
la consecuencia (por ahora gráfica) de introducir una tercera variable. Si a las variables 
“Actitud hacia el partido X” y “NES del individuo”, se agrega el “NES del padre”, cada 
una de ellas tricotomizadas, el cubo resultante sería el siguiente: 


NES del hijo M 


Actitud 
GRÁFICA 2 
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Como la representación gráfica global es decididamente complicada, se pueden 
presentar tres cortes en el cubo, cada uno de los cuales corresponde a la tercera variable 
introducida. La representación gráfica, en consecuencia, sería la siguiente: 


Nes del 
padre alto 


B 
xes del 


padre medio 


Actitud 


GRÁFICA 3 


Nótese que en cada sección del cubo se mantienen todas las posiciones de las 
variables NES del hijo y actitud hacia el partido político X, y que cada sección 
corresponde a una posición de la variable “NES del padre”. Es el simple recurso de 
mantener el espacio bidimensional colocando en el título la tercera variable introducida, 
lo que permite una representación más manejable, como se muestra en el cuadro 6. 


Cuapro 6 
Padre de NES bajo Padre de NES medio Padre de NES alto 
Actitud h , аз ho z 4 
r partido NES del hijo NES del hijo NES del hijo 

político “Х Bajo Medio Alto Total Bajo Medio Alto Total Bajo Medio Alto Total 
Favorable 2600 200 50 2850 150 200 50 400 40 100 -- 140 
Indiferente 850 500 150 1500 150 1600 150 1900 10 50 120 180 
Desfavorable 250 300 300 850 100 300 300 700 o — 480 480 

Total 3700 1000 500 5200 400 2100 500 3000 50 150 680 800 


Éste es el problema gráfico de introducir una tercera variable. Pero Іа introducción de 
una tercera variable es inseparable de las finalidades del análisis. Como se señaló antes, 
los análisis a partir de dos variables sólo expresan la asociación entre éstas, sin hacer un 
gran aporte de carácter explicativo. Sólo la introducción de una tercera variable permite 
decidir, dentro del sistema de variables que se considera, si la relación entre las dos 
primeras variables se mantiene, se refuerza, se especifica o desaparece. 

Supongamos que se quiere poner a prueba la hipótesis Ш: “Cualquiera que sea el 
nivel económico-social del padre, se mantiene Іа Бу”. 

Retomando nuevamente los problemas de lógica subyacente, cabe decir que, con la 
introducción de una tercera variable, se multiplica el número de grupos experimentales 
que se tenían en el análisis de dos variables por la cantidad de posiciones que tiene la 
tercera variable introducida. En el ejemplo, de los tres grupos experimentales iniciales 
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según el NES del individuo se pasa a tener nueve grupos experimentales (padre de NES 
bajo, hijo de NES bajo; padre de NES bajo, hijo de NES medio; padre de NES bajo, hijo de 
NES alto; padre de NES medio, hijo de NES bajo; padre de NES medio, hijo de NES medio; 
etc.). De esta manera, se está en condiciones de decidir sobre la hipótesis Ш, 
comparando los grupos experimentales, en base a las siguientes preguntas: 

1) Para cada nivel económico-social del padre, ¿se mantiene la relación primitiva 
entre NES del hijo y actitud hacia el partido político X? 

2) Para cada nivel económico-social del hijo, ¿se mantiene su relación con la actitud 
hacia el partido político X, si se consideran los distintos niveles económico-sociales de 
los padres? 

Las respuestas a estas preguntas, no sólo las respuestas afirmativas o negativas, sino 
las tendientes a explicar por qué, cómo y cuándo las relaciones se mantienen, se 
refuerzan, se especifican o desaparecen, son básicas en el análisis de los datos. 

Es conveniente considerar ahora un problema menos profundo que el del análisis, 
pero de mucha utilidad en el manejo de los datos. Como se ha hecho hasta ahora, 
supóngase que se pide la demostración de la hipótesis IV: “Cualquiera que sea el grado 
de desarrollo alcanzado por el país latinoamericano, se mantiene la hipótesis Ш”, y para 
determinar el grado de desarrollo de los países latinoamericanos, se proporcionan los 
datos del cuadro 7. 

Si se pretendiera manejar la propiedad-espacio definida por las posiciones en cada 
variable, el número de posiciones del sistema de tres variables sería elevado (20 x 20 x 
20). Por otra parte, interesa obtener un valor único. Ya se ha visto que esto puede 
lograrse (cuando se han dado ciertas condiciones) por medio de un índice sumatorio. 
Para la construcción del índice, se procede a ordenar de mayor a menor (o viceversa) los 
valores registrados en cada una de las variables. Las columnas 5, 6 y 7 del cuadro 7 
registran este ordenamiento, prescindiendo del país al que corresponde la hilera. 

Analizando cada una de las columnas 5, 6 y 7 por separado, se procede a simplificar 
las veinte posiciones dadas a sólo tres (siguiendo las líneas punteadas), según las 
consideraciones ya efectuadas al estudiar los índices sumatorios y la propiedad-espacio 
de una sola variable. La propiedad-espacio resultante (tres variables tricotomizadas) 
tiene р” = 27 posiciones, a cada una de las cuales corresponde un valor en el índice 
sumatorio el que, a su vez, tiene un puntaje mínimo 0 y un puntaje máximo 6. 
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CUADRO 7 


(1) ы G) (3) (4) (5) (6) (7) 
e po- 
ai Aa i- j 4 р д Р 
va en ас- а е фо- 
Países tividades por $ See e Стоп сина окин 
fabriles habit sabe leer > э кан 
propiam. рари у 
dichas 

Argentina 13.5 28 87 13.5 28 95 
Bolivia 2.8 7 32 18.0 28 87 
Brasil 6.2 13 49 9.1 21 80 
Colombia 4.3 12 63 8.0 21 80 
Costa Rica 4.8 14 80 6.7 16 78 
Cuba 8.0 21 78 6.5 15 70 
Chile 9.1 21 80 6.2 14 66 
Ecuador 3.5 10 56 4.8 14 63 
El Salvador 4.7 9 57 4.7 13 59 
Guatemala 3.2 6 20 4.7 12 57 
Haití 14 2 11 4.3 12 56 
Honduras 1.6 4 35 3.5 12 52 
México 6.7 14 59 3.3 10 | 49 
Nicaragua 2.0 $ 38 3.2 10 43 
Panamá 3.0 15 70 3.0 9 42 
Paraguay 3.3 12 66 3.0 7 38 
Perú 4.7 10 42 2.8 6 35 
Rep. Dominicana 3.0 12 43 2.0 4 32 
Uruguay 13.0 28 95 1.6 4 20 
Venezuela 6.5 16 52 1.4 2 11 


Como ya se ha visto con los índices sumatorios, si se consideran los puntajes 
extremos (0 y 6), no se presenta ningún problema especial. Esos puntajes pueden 
alcanzarse de una sola manera posible: teniendo el mismo puntaje en cada una de las 
variables. Con los restantes valores (1 a 5) se presentan problemas, pues éstos ya pueden 
obtenerse con distintas combinaciones de valores de las tres variables. El problema tiene 
una solución práctica: 

1) Se consideran “tipos puros” todas aquellas unidades que obtienen el mismo puntaje 
en cada una de las tres variables (bajo-bajo-bajo, alto-alto-alto, medio-medio-medio). 
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Солрзо $ 


Alta (6,5 — 13,5 
( Valor: 2? 


Мейа Mn = 6,2) 


Меда 


бүз Бей as- -23 220 бс 


Baja (1145) 
Val or 0 


Alta (70.95) 
Valor 2 


Cuabro 9 
Nivel de desarrollo Nivel de desarrollo Nivel de desarrollo 
NES Actitud hacia Bajo Medio Alto 
del el portido — =a o 
padre politico X маз DEL HIJO Nes DEL HIJO Nes DEL HIJO 
Војо Medio Alto Total Bajo Medio Alto Total Bajo Medio Alto Total TOTAL 
Bajo 
Favorable 1000 100 50 1150 900 50 — 950 700 50 — 750 2850 
Indiferente 300 200 5 550 300 200 5 550 250 100 50 400 1500 
Desfavorable 100 100 100 300 100 50 50 200 50 150 150 350 850 
Total 1400 400 200 2000 1300 300 100 1700 1000 300 200 1500 5200 
Мейіо 
Favorable 50 100 — 150 100 50 200 = 50 — 50 400 
Indiferente 50 300 50 400 50 500 50 600 50 $00 50 900 1900 
Desfavorable — 100 50 150 50 50 100 200 50 150 150 350 700 
Total 100 500 100 70) 200 600 200 1000 100 1000 200 1300 3000 
Alto 
Favorable — 30 — 50 40 30 o 70 -- 40 — 40 140 
Indiferente — 20 50 70 10 20 50 80 — 10 20 180 
Desfavorable — — 20 200 = — 150 150 — — 130 130 480 
Total ЕЗ 50 250 300 50 50 200 300 — 50 150 200 800 
Тош! 1500 950 550 3000 1550 950 500 3000 1100 1350 550 3000 9000 


2) Los puntajes restantes se adjudican de la siguiente manera: а) Dos puntajes iguales 
en dos variables y uno inmediato en la tercera, se otorga el puntaje obtenido en las dos 
variables (bajo-bajo-medio, se adjudica a valor bajo; alto-alto-medio, a valor alto; 
medio-medio-bajo o medio-medio-alto, ambos a valor medio). b) Dos puntajes extremos 
en dos variables y el puntaje opuesto en la tercera: se adjudica a valor medio (bajo-bajo- 
alto: a valor medio; alto-alto-bajo: a valor medio). 
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Con este procedimiento se obtienen tres valores: 1) el valor alto obtenido según a y 
bl; 2) el valor medio: obtenido según a, b1 y b2, y 3) el valor bajo, obtenido según a y 
bl. 

Esta reducción, que se basa en los valores numéricos acordados a las distintas 
posiciones de las variables, es la llamada reducción numérica (compárese con la 
reducción pragmática para retener mejor la diferencia entre ambas reducciones). 

Al obtener esta variable y volviendo al ejemplo, se tiene una propiedad-espacio 
definida por cuatro variables: grado de desarrollo del país, NES del padre, NES del hijo y 
actitud hacia el partido político X. Es decir, que la propiedad-espacio definida por estas 
cuatro variables tricotomizadas (según la expresión p”) proporciona 81 posiciones, tal 
como se observa en el cuadro. 

Un cuadro de estas dimensiones es, lisa y llanamente, ilegible. Las soluciones de 
presentación, que, por otra parte, son soluciones que facilitan el análisis de los datos, 
pueden ser dos: 1) La solución ya considerada de poner en el título una de las variables. 
2) La solución de presentar parcialmente los datos, efectuando el análisis de cada parte 
por separado. 


La substrucción 


Es frecuente encontrar en la literatura sociológica conceptuaciones como la que 


presentan Gerth y Mills sobre “la orientación hacia los controles sociales”: * 


і) Existe el tipo de hombre que estima o afirma una determinada norma, y en su 
conducta se sujeta a su convicción. її) Existe también el conformista y el oportunista 
falso. Externamente se ajusta al código, internamente no lo acepta. їїї) Un tercer tipo 
está representado por la persona que acepta verbalmente un código, pero que, en la 
conducta, se desvía de él. iv) Este tipo representa al desviado consistente, al 
disconforme en palabras y en hechos. 


Como hacen notar los autores, estos cuatro tipos se mueven en un sistema de dos 
variables: “la actitud hacia el ideal o la norma” y “la conducta con relación a la norma o 
ideal”, cada una de ellas con dos valores: positivo y negativo. Así, detrás de la 
“tipología” presentada se encuentra una propiedad-espacio definida por un sistema de 
dos variables dicotomizadas que, tal como hacen los autores, puede presentarse así: 


Actitud hacia el ideal o la norma 


+ A 
Conducta con 

relación a la + Tipo 1 Tipo П 
norma o ideal — Tipo Ш Tipo IV 


Pero no siempre los autores tienen el cuidado de presentar (o no se han percatado de) 
las variables subyacentes a sus conceptualizaciones y el panorama no se presenta claro. 
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La substrucción, así, es el procedimiento por el cual se intenta reconstituir el sistema 
de variables que definen la propiedad-espacio subyacente a uno o varios conceptos. 


Si se analiza la conocida definición de anomia como “ausencia de normas que regulan 


los medios y caminos que llevan a una meta socialmente aceptada”,? puede verse que, 


subyaciendo a la definición, hay dos variables: metas socialmente aceptadas y normas 
sobre medios y caminos para lograr las metas. Cada una de esas variables puede 
pensarse con dos posiciones: existencia-inexistencia. Con ello se puede reconstituir la 


propiedad-espacio definida: 
Metas socialmente aceptadas 


Anomia 


De tal modo, la substrucción es un procedimiento inverso a la reducción pragmática o 
a la clasificación articulada, que permite reconstituir: 1) Las variables incluidas en los 
conceptos o en la clasificación articulada. 2) La propiedad-espacio definida por el 
sistema de variables. 3) La reducción pragmática aplicada. 


Normas sobre caminos o medios Existen 


Logro de las metas No existen 


-————— a a a 


—_—_— e + 


Algunos autores (Barton entre ellos)? consideran que la substrucción es aplicable 
especialmente al tratar términos que designan individuos, o situaciones o relaciones 
“típicas”, o al considerar “tipologías”. Esto es acertado si no se confunden los términos 
“típico” o “tipológico” con los “tipos ideales” weberianos. El procedimiento es útil y 
válido cuando se piensa que el autor ha llegado a la formulación de los tipos o las 
tipologías por medio de una clasificación articulada o las combinaciones lógicas de los 
distintos valores de diferentes variables. Pero no se justifica en el caso de los tipos 
ideales que resulten o no de una clasificación articulada o de una combinación lógica de 
valores de variables; se basan metodológicamente en la comprensión y no en alguna 
forma de reduccionismo lógico-matemático. 


B) RAZONES, TASAS, PROPORCIONES Y PORCENTAJES 


Considerados ya los aspectos más importantes de la propiedad-espacio y con ello el 
primer tema enunciado al comenzar su tratamiento, queda por analizar el segundo tema, 
que hace referencia al tratamiento de los datos, utilizando las herramientas que proveen 
las matemáticas y la estadística. 

En este momento sólo cabe hacer el planteo introductorio al manejo más elemental de 
los datos por medio de razones, tasas, proporciones y porcentajes. 

Previamente, conviene tener a la vista cuáles son las operaciones realizadas hasta 
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llegar a este momento de la investigación. A partir de una hipótesis, se han recogido y 
codificado los datos y se ha definido la propiedad-espacio necesaria para disponer los 
datos de modo que permitan decidir sobre la aceptación o rechazo de la hipótesis. 

A continuación, lo obvio es el conteo. Es decir, la determinación de cuántas unidades 
entran en cada posición de la propiedad-espacio. Esto proporciona el número absoluto de 
unidades ubicadas en cada posición. Pero el número absoluto de unidades en cada 
posición es la cantidad de unidades de un grupo experimental que ha dado una respuesta 
determinada a un estímulo. Estos números absolutos son mayores, menores o iguales que 
los números absolutos que hay en otras posiciones de la propiedad-espacio. El hecho de 
que el número absoluto de una posición sea mayor, menor o igual que los de otras 
posiciones no permite extraer ninguna conclusión sobre el comportamiento de las 
unidades, ya que es muy distinto el significado de 100 unidades en un grupo de 200 que 
el de 1000 unidades en un grupo de 5 mil. 

Para poder extraer conclusiones es necesario poder comparar y para poder comparar 
es necesario recurrir a números relativos: números puestos en relación con otros números 
del mismo grupo experimental. Los números que están en cada posición de un grupo 
experimental pueden ponerse en relación: a) Con los valores absolutos de cada una de 
las otras posiciones del mismo grupo experimental. Estos números relativos son las 
razones y tasas. b) Con el total de las unidades del grupo experimental. Con este recurso, 
todos los grupos experimentales se igualan en el valor 1. Los números relativos así 
obtenidos son las proporciones. с) Con el total de unidades del grupo experimental, pero 
igualado con los otros grupos experimentales en el valor 100. Estos números relativos 
son los llamados porcentajes. 

Todo lo expuesto hasta el momento se verá más claramente con un ejemplo. 
Supóngase la hipótesis: “La movilidad ascendente tiende a hacer menos favorable la 
actitud hacia el partido político, y viceversa”. 

El cuadro de que se dispone es el siguiente: 

Antes de considerar los números relativos, debe notarse: 7) Que se tienen tres grupos 
experimentales: individuos con movilidad descendente, individuos inmóviles, individuos 
con movilidad ascendente, cuyos totales respectivos son 600, 6400 y 2000. 2) Que cada 
uno de esos grupos ha respondido en forma diferencial al mismo estímulo: la pregunta o 
el conjunto de preguntas para descubrir su actitud hacia el partido político X. 3) Que los 
números absolutos no permiten extraer conclusiones. Las 300 unidades de la posición o 
celda c son más que los 290 de la posición o celda a. En efecto, ¿puede decirse que los 
individuos con movilidad ascendente tienen una actitud más favorable hacia el partido 
político X que los individuos con movilidad descendente? Obviamente no, por la simple 
razón de que 300 en 2000 es mucho menos (en números relativos) que 290 en 600. 
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CUADRO 10 


Actitud hacia el Movilidad Movilidad Movilidad Total 
partido político X descendente nula ascendente 
Favorable 290 48%, 2800 449%, 300 15% 3390 
Indiferente 210 359%, 2570 40%, 800 40% 3580 
Desfavorable 100 17% 1030 16% 900 45% 2030 
Total 600 100% 6400 100%, 2000 100%, 9000 
Razones 


La razón de un número А con respecto a otro número В se define como А/В o A:B. Si В 
fuera el total del grupo, no se trataría de una razón, sino de una proporción. 

Con respecto a las razones, debe notarse que: 

1) Una razón puede ser menor, igual o mayor que 1. En el ejemplo, la razón de los 
individuos con movilidad descendente con actitud favorable hacia el partido político X a 
los individuos con movilidad descendente con actitud desfavorable hacia el partido 
político X es 290:100 = 2.9, es decir: 2.9:1. La inversa, que también es válida, es 
100:290 = 1:2.9, es decir, 0.34. 

2) Los números A y B pueden expresar cantidades distintas cualitativamente. Se 
puede pensar en una razón de hombres a mujeres, de peras a manzanas, etcétera. 

3) Debe tratarse de simplificar la expresión, eliminando del numerador y del 
denominador los factores comunes. 

4) Es conveniente expresar la razón reduciendo el denominador a la unidad. Si se 
toman los individuos inmóviles y se obtiene la razón de favorables a desfavorables, se 
tiene 2.800:1.030. Si esta razón se expresa como 2.80:1.03, es difícil su interpretación. 
Pero si se expresa сото 2.71:1, la interpretación se facilita. 

5) Si las posiciones son dos, la razón puede calcularse a partir de la proporción, y 
viceversa. Si se toma la razón de 290 a 100 (prescindiendo de los 210 indiferentes соп 
movilidad descendente), el total sería 390. La razón de 290:390 y de 100:390 se 
expresaría aproximadamente como 3:4 y 1:4. Pero, 290+100 = 390 y la proporción sería 
+ + = 0,74+0.26, lo que es lo mismo que decir 3:4 y 1:4, aproximadamente. 

6) El cálculo de las razones tiene un grave inconveniente de legibilidad: a medida que 
aumenta el número de categorías dentro de cada grupo experimental el manejo de las 
razones se vuelve engorroso. Si dentro de un grupo experimental hay tres posiciones 
posibles, el número de razones que se puede obtener resulta de la combinatoria de 
posiciones, según la expresión p! (factorial de p.) Si en el ejemplo se toma a los 
individuos con movilidad ascendente, las razones posibles con tres categorías serían: 
300:900; 300:800; 800:900; 900:800; 900:300; 800:900. Es decir, 3! =6. Si se tuvieran 
cinco posiciones en un grupo experimental, las razones posibles serían 5! = 120. Esto es 
lo que determina la escasa utilización de las razones en análisis sociológicos. 
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En el ejemplo propuesto, tomando la razón de individuos con actitud favorable а 
individuos con actitud desfavorable, se tendría: 


Movilidad ascendente Inmóvil Movilidad descendente 
2.9 2.71 0.15 


con lo que se tendría demostrada la primera parte de la hipótesis. 


Tasas 


Las tasas no son sino una clase de razón que, por tener un denominador muy grande que 
haría impracticable, difícil o ilegible el resultado, se obtiene multiplicando el numerador 
por una constante k = 100, 1000, 10000, etcétera. 

Hay tasas ya establecidas en que se conoce el valor de la constante (k). De esta 
naturaleza son la mayoría de las tasas utilizadas en demografía. Pero si la tasa que se 
utiliza no es del tipo antes enunciado, hay que dejar constancia expresa del valor que se 
acuerde a la constante (k). Por ejemplo, si se calcula la tasa de criminalidad de 
localidades de menos de 100 mil habitantes, la constante k deberá tener un valor de 
10000 o de 100000; pero si se calcula la misma tasa de criminalidad para ciudades de 
más de 1000 000 de habitantes, la constante k deberá valer 100000 o 1000000. 

Una tasa muy importante es la tasa de crecimiento, que se obtiene tomando los 
valores de una unidad en una variable en dos tiempos distintos (el tiempo inicial —Т/ y el 
tiempo final —72). Esta tasa de crecimiento se calcula aplicando la siguiente expresión: 
12 жү Esto es, se mide cuánto se ha incrementado la unidad desde el tiempo inicial al 
tiempo final y se divide por el tiempo inicial. Esta tasa es de aplicación muy frecuente en 
estudios sobre urbanización, desarrollo económico, etc. El problema subsistente es el de 
la homogeneidad de los periodos, ya que las tasas de crecimiento de dos unidades no 
serían comparables si se toma un periodo para una unidad (supóngase 5 años) y otro 
periodo para la otra (supóngase 10 años). La tasa de crecimiento puede ser positiva o 
negativa. 


Proporciones 


Una proporción se obtiene dividiendo el número de casos en cada posición de una 
variable (o de un grupo experimental) entre el total de casos de esa variable (o de un 
grupo experimental). 

En el ejemplo propuesto y para los móviles ascendentes, se tendrían las proporciones 
siguientes: 300/2000; 800/2000 y 900/2000. 

Respecto a las proporciones debe notarse que: 

1) La proporción es lo que en estadística se llaman frecuencias relativas. 

2) Las variables o grupos experimentales de los que se calculan las proporciones 
deben estar correctamente clasificados (en forma exhaustiva y mutuamente excluyente). 

3) La suma de los numeradores de las proporciones de cada grupo es igual al 
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denominador o, lo que es lo mismo, al total. En el ejemplo: 300 + 800 + + 900 = 2000. 

4) Cada proporción es siempre menor o igual a 1. 

3) La suma de todas las proporciones de cada variable o de cada grupo experimental 
es igual a 1. Debe notarse que, con este procedimiento, los grupos experimentales o 
variables se igualan a 1. Este procedimiento de igualar los totales en una cifra se llama 
“normalización” o “estandarización”. 

6) Es importante tener en cuenta sobre qué total se calculan las proporciones. Si se 
vuelve al ejemplo, se podría disponer los datos, según la dirección de la movilidad, en la 
siguiente forma: 


Móviles 2600 0.29 — — 
Ascendentes: 2000 — 0.22 0.77 
Descendentes: 600 — 0.07 0.23 

Inmóviles 6400 0.71 0.71 — 

9000 1.00 1.00 1.00 


Según este ejemplo, la proporción de móviles e inmóviles se calcula sobre un total de 
9000 unidades. 2600/9000 y 6400/9000 = 0.29 + 0.71 = 1.00. Las proporciones de 
móviles descendentes, ascendentes e inmóviles también se calculan sobre un total de 9 
000: 2000/9000, 600/9000 y 6400/9000, es decir: 0.22 + 0.07 + 0.71 = 1.00. Pero las 
proporciones de móviles ascendentes y descendentes se calcula sobre un total de 2600, a 
saber: 2000/2600 y 600/2600. Es decir: 0.77 + 0.23 = 1.00. 

Pero, en general, en análisis sociológicos, las proporciones son muy poco utilizadas 
porque los números decimales dificultan su lectura. 


Porcentajes 


Los porcentajes resultan de multiplicar por 100 el número de unidades en una posición 
del grupo experimental (o de la variable) y dividir el producto por el total de unidades de 
la variable (o del grupo experimental). 

Para demostrar una de las ventajas de la utilización de los porcentajes, es conveniente 
volver al ejemplo inicial y presentarlo sólo en base a ellos. 
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Cuapro 11. Porcentaje de individuos según la dirección de su movilidad 
y su actitud hacia el partido político X 


à Movilidad ; Movilidad 
Actitud descendente Inmóviles ascendente 
Favorable 48 44 15 
Indiferente 35 40 40 
Desfavorable 17 16 45 
Total 100% 100% 100% 
(N: 600) (м: 6 400) (м: 2 000) 


Con respecto a este cuadro, debe notarse: 

1) La exclusión de los números absolutos aclara notablemente la presentación y 
facilita la lectura, sin que por ello se pierda información, ya que el hecho de consignar 
los totales debajo de los 100% permite reconstruir el cuadro original calculando los 
números absolutos de cada posición con una simple operación inversa a la que llevó a 
obtener los porcentajes. 

2) Los distintos grupos experimentales son comparables porque todos ellos han sido 
igualados (normalizados, estandarizados) en 100. 

3) Aunque es difícil dar una regla de validez absoluta, los autores coinciden en que no 
deben calcularse porcentajes, a menos que el total de unidades sea de alrededor de 50 
casos. Algunos autores dan una cifra de 20 a 30 casos. Pero todas estas cifras dependen 
del número de posiciones que haya en la variable (o en el grupo experimental). Puede ser 
válido calcular porcentajes de una dicotomía cuando el total de casos es 30, y no serlo 
calcular porcentajes de una variable con cinco posiciones cuando el total es 50. 

4) En general, no deben incluirse los decimales, ya que con ello se pierde una ventaja 
del uso de los porcentajes (la facilidad y claridad de lectura). Sin embargo, los decimales 
deben calcularse cuando: a) el número de casos es muy grande y se justifica obtener una 
diferencia porcentual muy pequeña; b) es necesaria la precisión como sucede еп la 
determinación de personas que han sanado (o enfermado) con la utilización de cierto 
medicamento; c) se prevé la realización de futuras mediciones, cuyos resultados no se 
conocen al practicar la medición actual. En este caso, hay que tratar de conservar las 
diferencias mínimas. 

3) Por otra parte, los porcentajes son un instrumento que, si bien es superior a las 
razones y proporciones, es siempre elemental para el análisis, ya que sólo indican la 
dirección de la relación entre las variables, pero no la fuerza de la asociación entre ellas. 

Cabe ahora preguntarse ¿cómo se calculan los porcentajes?, ¿cómo se leen los 
porcentajes?, ¿hay que volver a la lógica subyacente del diseño experimental, y a la 
propiedad-espacio? 

El encabezamiento de cada columna indica cómo se han constituido los grupos 
experimentales. En el ejemplo, los grupos difieren en movilidad y en dirección de la 
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movilidad. Ésa es la variable independiente, aquella que para este estudio se considera 
que causa, determina, influye en la variable dependiente (actitud hacia el partido político 
X). La hipótesis adelanta que aquello en lo cual los grupos se diferencian (la dirección de 
la movilidad) es causa determinante o influyente en la variación o no variación de las 
respuestas al mismo estímulo, sea éste un indicador simple (una pregunta) o compuesto 
(un índice, una escala). 

Teniendo en cuenta las consideraciones precedentes, es claro que los porcentajes 
deben calcularse en el sentido en que se han constituido los grupos experimentales (ya 
sea éste el sentido de las columnas o el de las hileras). Así se obtendrá la respuesta 
diferencial (y comparable) de cada grupo al estímulo. Se acostumbra a calcular los 
porcentajes en sentido vertical, porque se acostumbra a encabezar la columna con las 
variables consideradas independientes. 

Por consiguiente, los porcentajes se leen en el sentido transversal a aquel en que se 
han calculado. Así se pueden ver las diferencias o las similitudes en frecuencias relativas 
de cada grupo experimental а los mismos grados del estímulo común. 

Volviendo al ejemplo, se notará que la variable considerada independiente es la 
dirección de la movilidad. En base a ella se han constituido los grupos experimentales de 
individuos con movilidad descendente, los individuos inmóviles y los individuos con 
movilidad ascendente. Por eso los porcentajes se han calculado siguiendo las columnas. 
Pero la lectura procede en orden transversal a aquel en que se han calculado los 
porcentajes. Así se ve que los individuos con actitud favorable son un 48% de los 
descendentes, un 44% de los inmóviles y un 15% de los ascendentes. Por lo cual se 
puede concluir que los individuos con movilidad descendente tienen una actitud más 
favorable al partido político X que los individuos con movilidad ascendente. El mismo 
procedimiento puede seguirse con las hileras correspondientes a los indiferentes y a los 
que tienen actitud desfavorable. 

Pero en realidad, dada la hipótesis que se había pedido comprobar, el cuadro se 
presenta con más datos que los necesarios. Tanto el cuadro que presenta los datos como 
el diseño de la propiedad-espacio deben ser lo más simples posibles con relación a la 
hipótesis. Como la hipótesis relacionaba sólo movilidad ascendente y descendente con 
actitud favorable y desfavorable, el cuadro inicial debería expresarse de la siguiente 
manera: 
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CUADRO 12 


Actitud hacia el Movilidad Movilidad 
partido político X descendente ascendente 
Favorable 75% 25% 
Desfavorable 25% 75% 
Total 100% 100% 

(м: 390) (х: 1200) 


Pero como se ha señalado al considerar la propiedad-espacio, es muy poco lo que dice 
un análisis de dos variables. Si se agrega una tercera variable, el análisis se enriquece 
muchísimo. 

Supóngase la hipótesis: “Cualquiera que sea el grado de desarrollo del país 
latinoamericano, vale la hipótesis de que los individuos móviles descendentes tienden a 
tener una actitud favorable hacia el partido político X y viceversa”: 


CUADRO 13 


Grado de desarrollo 


Descendente Ascendente Descendente 


Ascendente Total 
Actitud hacia 
el partido político X. 


Favorable 


Desfavorable 


Lo primero que conviene notar es que, si se pusiera en el título uno de los valores de 
la variable actitud hacia el partido político X, no se perdería información y el cuadro 
podría presentarse de la siguiente manera: 


CUADRO 14. Porcentaje de individuos con actitud favorable hacia el partido político Х, 
según grado de desarrollo del país y dirección de la movilidad 


Movilidad Desarrollo bajo Desarrollo alto 
Descendente 100 45 
Ascendente 37 10 
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El porcentaje de individuos con actitud desfavorable hacia el partido político Х 
resulta de la simple operación de restar 100 de los valores correspondientes a cada 
posición (0 en la celda a, 55 en la celda b, 63 en la celda су 90 en la celda d). Nótese, al 
pasar, que los individuos con movilidad descendente de los países con bajo desarrollo 
aparecen teniendo más actitud favorable hacia el partido político X que los móviles 
descendentes de los países de alto desarrollo, y que los móviles ascendentes de países 
con bajo desarrollo también tienen una actitud más favorable hacia el partido político X 
que los móviles ascendentes de los países con alto desarrollo. Esto modifica las 
observaciones anteriores, y así aparece modificada la relación entre movilidad y actitud 
hacia el partido X por la introducción de la tercera variable: grado de desarrollo del país. 
Con esta observación podría aceptarse la hipótesis planteada, aunque modificada. 

Conviene considerar más de cerca lo que sucede con la introducción de una tercera 
variable. Llamemos a la variable considerada más independiente (o condicionante, o 
antecedente) variable х; a la variable interpuesta, variable t, y a la variable dependiente, 
variable y. En este caso se trataría de grado de desarrollo del país, dirección de la 
movilidad y actitud hacia el partido político X, respectivamente. 


GRÁFICA 4 


Х X, X£, 
yı 
3 -4 No 3 4 No 


= 
Д. 


Tal como hace Zeigel,” el cuadro anterior podría esquematizarse a los fines de su 
presentación y análisis como aparece en la gráfica de la página anterior. 

A partir de este esquema, conviene seguir los siguientes pasos para su presentación y 
análisis: 

1) Presentación y análisis de los marginales de х:х/ y x2. Según ejemplo, se trata de 
dos grupos de individuos móviles: uno con 480 individuos móviles de un país de bajo 


269 


desarrollo y otro con 590 individuos móviles de un país de alto desarrollo. Éstas son las 
celdas que en el esquema se señalan con el número 1. 

2) Presentación y análisis de los marginales de la variable £ (celdas número 2 del 
esquema), lo que origina el siguiente cuadro: 


CUADRO 15 


Bajo desarrolio Álto desarrollo 
Movilidad descendente 17% 15% 
Movilidad ascendente 83% 85% 
100%, 100% 
(м: 480) (х: 590) 


De este cuadro se puede concluir que la dirección de la movilidad es similar en ambos 
tipos de países. 

3) Presentación y análisis de las respuestas al estímulo de los distintos grupos 
experimentales: a) Presentación y análisis de las respuestas dadas por el grupo de 
movilidad descendente de países con bajo desarrollo y el grupo de movilidad 
descendente de países con alto desarrollo (celdas número 3 del esquema), lo que 
proporciona el siguiente cuadro: 


Cuabro 16. Porcentaje de individuos con movilidad descendente, 
según el grado de desarrollo del país 


Actitud hacia el 


partido político X тир ато Alto desarrollo 
Favorable 100% 45% 
Desfavorable — 55%, 
100% 100%, 
(м: 80) (ч: 90) 


Del análisis de este cuadro puede concluirse que el grado de desarrollo del país tiene 
incidencia en la actitud hacia el partido político X entre individuos de movilidad 
descendente, ya que tienen actitud favorable 100% de los descendentes móviles de 
países con bajo desarrollo y sólo 45% de móviles descendentes de países con alto 
desarrollo, mientras que entre los móviles descendentes de países con bajo desarrollo no 
se registra actitud desfavorable y entre los móviles descendentes de países con alto 
desarrollo se registra 55% con actitud desfavorable. b) Presentación y análisis de las 
respuestas dadas por el grupo de movilidad ascendente de países con bajo desarrollo 
(celdas número 4 del esquema), lo que proporciona el siguiente cuadro: 
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Солрко 17. Porcentaje de individuos con movilidad ascendente, 
según el grado de desarrollo del país 


Actitud hacia el Bajo Aito Diferencia 
partido politico X desarrollo desarrollo porcentual 
Favorable 37% 10% + 27 
Desfavorable 63% 90% — 27 
100% 100% 0 

(м: 400) (м: 500) 


Del análisis de este cuadro puede concluirse que, рага los móviles ascendentes, el grado 
de desarrollo del país también tiene incidencia en la actitud hacia el partido político X y 
que dicha incidencia se manifiesta en la misma dirección que para los móviles 
descendentes, aunque mucho más debilitada (obsérvese el comportamiento de la 
columna llamada diferencia porcentual). 

Luego de estos análisis elementales se está en condiciones de decidir sobre la 
hipótesis planteada. Los datos permiten aceptar la hipótesis en el sentido de que, 
cualquiera que sea el grado de desarrollo del país, los individuos móviles descendentes 
tienden a tener una actitud favorable hacia el partido político X y viceversa. Pero con la 
importante especificación de que, si se mantiene constante la dirección de la movilidad, 
la hipótesis aparece especificada en el sentido de que la relación entre grado de 
desarrollo del país y actitud hacia el partido político X se acentúa entre los individuos 
móviles descendentes y se debilita entre los individuos móviles ascendentes. 

Se observará que en el esquema hay celdas en las que se lee “No”. Tal vez sea 
innecesario decir que “No” no significa “Nunca”, pero conviene tenerlo presente. Esto 
quiere decir que, si en la constitución de los grupos experimentales se ha conservado o se 
estima que se ha logrado conservar la proporción que tales grupos tienen en el universo, 
entonces (y sólo entonces) es válido y lícito analizar las celdas correspondientes a los 
marginales de la variable dependiente (y) respecto de cada uno de los valores de la 
variable independiente (x). En el ejemplo, sólo si se supiera que la proporción de 
unidades medidas según los grados de desarrollo de los países es equivalente a la 
proporción de unidades en el universo de esos países, podría pensarse en analizar уу е y2 
рага x; y x7. Como este dato se desconoce, no puede procederse a tal análisis. En todo 
caso, la presentación y análisis serían similares a los presentados anteriormente. 


Medición del cambio porcentual 


En numerosas ocasiones es necesario determinar el incremento porcentual que ha sufrido 
un valor de una variable en un grupo dado. Si se piensa en un programa o proyecto, 
deben instrumentarse modos de evaluar dicho programa o proyecto. Por ejemplo, se 
desea determinar la eficacia de un programa para difundir entre las madres el 
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conocimiento de ciertos elementos de higiene infantil. La mejor manera es constituir dos 
grupos de madres que sean lo más parecidos posibles en características básicas: nivel 
económico-social, nivel educacional, vivienda, disponibilidades diversas, etc. Uno de los 
grupos (el experimental) será sometido al programa, mientras que el otro grupo (el de 
control) no será sometido al programa. Al tiempo de iniciarse el experimento se mide el 
conocimiento que ambos grupos tienen de los elementos de higiene infantil que se quiere 
difundir. Esto proporciona un porcentaje (ру) de madres que, antes del experimento, 
conocen los elementos de higiene. Después de sometido el grupo experimental al 
programa proyectado, se procede a una nueva medición que nos proporciona otro 
porcentaje de madres (p2) que conocen los elementos de higiene. 
El caso podría presentarse de la siguiente manera: 


Cuanro 18 
Grupo Grupo 
experimental de control 
Nivel de conocimiento inicial (+,) 10% 80% 
Sometimiento al programa sí no 
Nivel de conocimiento final (Р,) 20% 90% 


Una forma de medir el cambio porcentual es calcular la diferencia porcentual, que se 
obtiene restando del nivel final el nivel inicial: P) — Ру. En el caso del ejemplo, se 
obtendría para el grupo experimental (de ahora en adelante GE) un incremento de 10% y 
para el grupo de control (de ahora en adelante GC), un incremento del 10%. 

Otra manera de medir el cambio porcentual es mediante la aplicación de la tasa de 
cambio, es decir, dividiendo por el nivel inicial, la diferencia entre el nivel final y el 


nivel inicial: A En el caso del ejemplo, se tendría que el GE ha tenido un incremento 
porcentual de 100%, mientras que el GC sólo ha aumentado en 12.5%. 

Pero, tanto la diferencia porcentual como la tasa de cambio porcentual tienen un 
defecto básico, que es prescindir del incremento potencial (100 —P;). En el ejemplo, el 
GE parte de 10% y su incremento potencial es de 90%, mientras que el GC parte de 80% 
y su incremento potencial es de sólo 20%. Resulta claro que, para obtener una medida 
comparable del cambio porcentual, hay que incluir el incremento potencial en dicha 
medida. 


A tal efecto, Hovland et al.* exponen un índice de efectividad que resulta de dividir 
P,—P, 
рог el incremento potencial la diferencia entre el nivel final y el nivel inicial: i00 -P . En 
el ejemplo, medido por el índice de efectividad, el СЕ ha aumentado en 11% y el GC en 
50%. 
Las conclusiones а que conduce la aplicación de cada una de estas formas de medir el 


cambio porcentual son muy distintas y debe considerarse en cada caso cuál de ellas 
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corresponde aplicar. 

Conviene analizar otro aspecto del índice de efectividad. Cuando se efectúan las 
mediciones en realidad no se encuentra sólo dos categorías de individuos: los que tienen 
la propiedad (en el ejemplo, conocer los elementos de higiene) y los que no tienen la 
propiedad, sino tres categorías de individuos, a saber: 7) Los que verdaderamente tienen 
la propiedad, a los que se denominará con la letra К (Кү en la medición inicial, К» en la 
medición final). 2) Los que verdaderamente no tienen la propiedad, 100 — Ку en la 
medición inicial y 100 — К» en la medición final. 3) Los que verdaderamente no tienen 
la propiedad, pero que por distintas razones se registran como teniéndola. Los individuos 
de esta categoría son una cierta proporción porcentual de los individuos de la categoría 
anterior: x(100 — К) en la medición inicial y x(100 — К»), en la medición final. 

Teniendo en cuenta estas categorías, los individuos que aparecen teniendo la 
propiedad en la medición inicial son: Kı + х(100 — КІ); y en la medición final son К» + 
x(100 — K>). Es decir, 


Р, = К, + x(100 — K,) 
y 
P, = K, + x(100 — К) 


Si se remplazan las nuevas expresiones para Ру у Р» en la fórmula del índice de 
efectividad, se obtiene: 


Р.Р, _ K, 4 x(100—K;) — К, + x(100 — K,) 
100=P, 7 7100-К, + (100-4) 
К, + x(100 — К,) — К, — x(100 — К,) 


EN Eor OA s a pa ЗЬ анн 
100 — К, — x(100 — K,) 


2) Por distributividad = La ES ii E ШАГ знн, ды кА, 
100 — К, — 100x — xK, 


К„—хК„—К,—хК, 
3) Рог inverso =  —————— 
100 — Ж, — 100x — хк, 


AR ARAS 
100(1=x) К х) 


К.-К, 
5) Рог cancelatividad = ——— 
100 — К, 
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Con esto, el índice de efectividad queda expresado en función de los individuos que 
verdaderamente tienen la propiedad. Obviamente, la aplicación de esta fórmula supone 
que, de alguna manera, se ha podido estimar la proporción de individuos que aparecen 
teniendo la propiedad, aunque en realidad no la tienen. 

Los que se han planteado hasta el presente son los problemas más importantes del 
uso, cálculo, lectura y significación de los porcentajes. Queda todavía un problema 
menor. Es frecuente encontrar en las alternativas de respuesta para las preguntas de un 
cuestionario las alternativas No sabe, No responde, No sabe/No responde. 

Estas alternativas pueden tener un doble significado: 7) Cuando se quiere averiguar si 
la unidad sabe o no sabe alguna cosa, la alternativa No sabe tiene un significado 
autónomo e importante para la investigación. 2) Cuando no se quiere averiguar 51 la 
unidad sabe o no sabe alguna cosa, las alternativas No sabe, No responde, No sabe / No 
responde son sólo categorías residuales introducidas a efecto de mantener la 
exhaustividad de la clasificación. 

En el caso de tratarse de alternativas autónomas, lo normal es tratar de detectar cuáles 
son los motivos por los cuales las unidades no saben acerca del asunto en cuestión: 
porque no están informadas, porque están insuficientemente informadas, porque han 
recibido información distorsionada, o porque están evadiendo la respuesta a la pregunta 
formulada. 

En el caso de tratarse de alternativas residuales pueden presentarse dos situaciones 
principales: 

1) Las unidades que responden No sabe son pocas. En este caso puede prescindirse de 
la categoría. 

2) Las unidades que responden No sabe son muchas. Las medidas previas que deben 
adoptarse para que las frecuencias de No sabe no sean elevadas hacen referencia a las 
instrucciones, a los entrevistadores y a analizar detenidamente los resultados de la 
prueba previa del cuestionario. Pero si todavía la frecuencia de individuos que responden 
No sabe es muy alta, pueden seguirse tres procedimientos que deben justificarse en cada 
caso: a) suponer que las respuestas No sabe se distribuyen al azar entre las restantes 
alternativas. Entonces se adjudica en forma proporcional a cada una de las alternativas 
restantes el total de individuos que respondieron No sabe. Este procedimiento es poco 
aconsejable; b) excluir directamente las respuestas No sabe y calcular los porcentajes 
para las alternativas restantes en base al nuevo total que resulta de excluir a los que 
respondieron No sabe; с) suponer que la respuesta No sabe es, en realidad, una evasiva. 
En este caso hay que buscar en el cuestionario alguna otra pregunta altamente asociada 
con aquella en que se han registrado numerosos No sabe y adjudicar los individuos que 
respondieron No sabe, según la respuesta dada en esa pregunta altamente asociada. Este 
procedimiento, que se podría llamar de consistencia de respuestas, es más aconsejable 
que los otros dos siempre que la asociación entre las respuestas a las preguntas sea 
realmente alta y que, en lo posible, se analice la asociación con más de una pregunta. 
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IX. ANÁLISIS DE DATOS: PAQUETE ESTADÍSTICO PARA LAS 
CIENCIAS SOCIALES (SPSS): OFERTA Y CONDICIONES PARA SU 
UTILIZACIÓN E INTERPRETACIÓN DE RESULTADOS 


JORGE PADUA 


EL ENORME desarrollo experimentado en los aparatos electrónicos en el almacenaje y 
procesamiento de datos, unido al acceso relativamente fácil de los investigadores a estas 
computadoras, abre para el científico social nuevas posibilidades tanto para el 
tratamiento de datos en gran escala cuanto para la aplicación de técnicas estadísticas 
complejas, en lo matemático o en lo referente a la cantidad de tiempo requerido para su 
cómputo manual. 

El uso de computadoras para el análisis de datos requiere una serie de pasos: 

a) Los datos deben ser preparados de manera tal que puedan ser “alimentados” a la 
máquina, es decir, los datos deben estar en la forma de tarjetas perforadas, cinta 
magnética, disco, o alguna otra forma especial (cintas de papel, por ejemplo). 

Б) El investigador debe decidir qué es lo que quiere hacer con sus datos, es decir, qué 
tipo de cálculo va a solicitar; correlaciones, coeficientes de confiabilidad, análisis de 
varianza, etcétera. 

c) Es necesaria la preparación de un “programa”, que no es otra cosa que una guía de 
instrucciones que describe para la máquina la forma como los cálculos deben ser 
realizados. 

d) Es necesario confeccionar además una serie de instrucciones para poner un 
conjunto particular de datos en un determinado centro de computación, para un 
determinado programa de cálculo. Esto es lo que se llama en la jerga técnica “job”. 
Típicamente cada job consiste de varios mazos de tarjetas: i) tarjetas de sistema (system 
cards); й) programa; iii) control de tarjetas paramétricas, y iv) datos. Las tarjetas de 
sistema varían de un centro de computación a otro, y por lo general éstos instruyen a sus 
usuarios sobre la preparación de tarjetas, o se encargan ellos mismos de confeccionarlas. 
Estas tarjetas incluyen nombre del usuario, de la investigación, nombre de variables, etc. 
En la mayoría de los casos incluye además una tarjeta con el nombre del programa. El 
programa es la lista de instrucciones que especifican el tipo y el orden de las 
operaciones que la computadora va a efectuar. Cuando el programa está ubicado en la 
memoria de la computadora, se ubica por medio de una de las tarjetas del sistema. Las 
tarjetas paramétricas (o tarjetas de control) son una lista de instrucciones específicas 
para un juego de datos en particular y para el problema específico. Por lo general, estas 
tarjetas incluyen tarjetas de problemas, tarjetas opcionales y tarjetas de formatos. Las 
tarjetas de problemas contienen una descripción del job específico (número de 
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observaciones, número de variables, forma del input y del output, etc.). Las tarjetas de 
formatos instruyen a la máquina sobre dónde y cómo encontrar los datos en cada tarjeta, 
cinta o disco. Las tarjetas opcionales programan la máquina para hacer exactamente lo 
que debe hacer y con qué exactitud. 

El objetivo específico de este trabajo es delinear algunos principios estadísticos y 
metodológicos referidos a los programas, particularmente a aquellos incluidos en el SPSS 
(Statistical Package for the Social Sciences), “Paquete estadístico para las ciencias 
sociales”, uno de los programas más completos y de mayor difusión en el medio 
académico y de investigación en el hemisferio occidental. 

En la medida en que fueron los estadísticos у los psicometristas los que —de los 
científicos sociales— han utilizado más las computadoras, no es de extrañar que los 
programas más refinados se concentren en cálculos estadísticos; sin embargo, hay una 
generalización cada vez más creciente del uso de computadoras en una variedad de 
disciplinas (medicina, música, administración, simulación de relaciones internacionales, 
estrategia, etc.) que son una indicación de la flexibilidad de estas máquinas para realizar 
tareas complejas, al mismo tiempo que nos alertan sobre la necesidad de tener acceso a 
programadores y analistas de sistemas con cierto grado de familiaridad con los 
problemas sustantivos de disciplinas en particular y que sean capaces de preparar las 
computadoras para cálculos y operaciones no complementados en programas de tipo 
“paquete”. 

Finalmente, quiero alertar al lector sobre las descripciones que aparecen en las 
secciones siguientes: me he preocupado de hacer accesible cada una de las posibilidades 
que aparecen en el sPss; las más de las veces he seguido de cerca el estilo y el ejemplo 
de los autores del Manual, otras veces incluyo algo más de información. Todo el 
razonamiento es de carácter verbal, más que matemático, y la idea es presentar al 
investigador no familiarizado con la estadística matemática las opciones que hay en el 
programa, cuándo utilizarlas, cómo interpretar los outputs, etc. Para más detalles, en 
cada una de las diferentes técnicas existe abundante bibliografía que puede ayudar al 
lector a un uso más preciso del rico material de cálculo disponible en el sPss. 

La utilidad que puede tener este tipo de enfoque está en relación directa con el 
desconocimiento que el lector tenga de las limitaciones de cada uno de los estadísticos. 
Con demasiada frecuencia se solicita a los centros de computación cálculos que utilizan 
valioso tiempo de programación y de computadora para resultados finales sin ninguna 
significación. Por ejemplo, ocurre que el usuario solicita cálculos de correlaciones 
Pearsons para variables y atributos tales como sexo, opiniones, pertenencia a clase, etc. 
Ahora bien, una de las limitaciones de la correlación Pearsons es que las variables tienen 
que estar medidas a nivel intervalar al menos, y algunas de las variables que el usuario 
empleaba estaban medidas a nivel nominal u ordinal. ¿Quiere decir que no es posible 
utilizar correlaciones? De ninguna manera; simplemente lo que quiere decir es que había 
que computar el coeficiente de correlación o de asociación apropiado. Más adelante se 
analizarán algunas alternativas. 

Otro problema bastante común y asociado a los niveles de medición es el de 
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seleccionar las estadísticas apropiadas para un conjunto determinado de datos, a partir 
del output de la computadora. Muchos programas (por ejemplo el subprograma crosstab) 
producen una serie de coeficientes de asociación, de los cuales el investigador debe 
seleccionar los que corresponden a sus datos; muchas veces ocurre que se publican todos 
o se utilizan algunos indebidamente. 

En este trabajo, vamos a ocuparnos del paso b y en parte del paso c en el uso de 
computadoras. Es decir, vamos a proponer algunos estadísticos —la mayoría de los 
cuales están contenidos en un programa denominado sPss— de manera tal que el 
investigador decida más apropiadamente qué quiere hacer con sus datos, qué tipo de 
cálculo va a solicitar, etcétera. 


NIVELES DE MEDICIÓN 


Uno de los requisitos teóricos más importantes para la utilización eficiente de modelos 
matemáticos o estadísticos es que éstos sean isomórficos con el concepto o el conjunto 
de conceptos que los modelos representan. En otras palabras, el modelo matemático debe 
tener la misma forma que el concepto. De no ser así, cualquier tipo de operación es 
ilegítima. 

Las reglas para la asignación de números a objetos, conceptos o hechos están 
determinadas por una serie de teorías distintas, donde cada una de ellas se denomina 
nivel de medición. La teoría de la medición especifica las condiciones en que una serie 
determinada de datos se adaptan legítimamente a un nivel u otro, de manera que exista 
isomorfismo entre las propiedades de las series numéricas y las propiedades del objeto. 
De esta manera es posible utilizar el sistema matemático formal como un modelo para la 
representación del mundo empírico o conceptual. 

Toda medición tiene tres postulados básicos, que son necesarios para igualar, ordenar 
y añadir objetos. Estos principios o postulados son: 1) a = b o a+b, pero no ambos al 
mismo tiempo. 2) Sia = Ь у Ь = с, entonces а = с. 3) Si a>b y b>c entonces а> с. 

El primer postulado es necesario para la clasificación. Nos va a permitir determinar 51 
un objeto es idéntico o no a otro en virtud del atributo que consideramos. Manteniendo 
constante la dimensión tiempo, establece relaciones excluyentes. El segundo postulado 
nos capacita para establecer la igualdad de un conjunto de elementos con respecto a una 
característica determinada. Es el principio de la transistividad de igualdades. El tercer 
principio, o principio de la transistividad de desigualdades o inecuaciones, nos permite 
establecer proposiciones ordinales o de rango. 

Con base en estos postulados y de acuerdo con el tipo de operaciones empíricas que 
se puedan realizar con los atributos del universo que se desea escalar, hay cuatro tipos 
distintos de niveles de medición: a) Nominal, b) Ordinal, c) Intervalar, y d) Por cocientes 
o racionales. 

Cada uno de estos niveles se caracteriza por el grado en que permanecen invariantes. 
La naturaleza de esta invariancia fija los límites a los modos de manipulación estadística 
que pueden aplicarse legítimamente a los datos incluidos en el nivel de medición. 
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A) Nivel nominal 


Es la forma más elemental de medición, en la que simplemente se sustituyen los objetos 
reales por símbolos, números, nombres. Esta clasificación de los elementos de un 
universo de acuerdo a determinados atributos da a la medición a este nivel un significado 
más cualitativo que cuantitativo. 

Para “medir” en este nivel, se asignan símbolos o signos al atributo del objeto o 
conjunto de objetos que se desea medir, con la condición básica de no asignar el mismo 
signo a categorías que son diferentes; o diferentes signos a la misma categoría. 

Por medio de esta escala simplemente diferenciamos los objetos de acuerdo con la 
categoría a la que pertenecen. Ejemplos de medición de variable a nivel nominal: 

Sexo (masculino-femenino). 

Religión (católico, protestante, judío, mahometano, otra). 


B) Nivel ordinal 


En este nivel de medición, los objetos no solamente aparecen como diferentes, sino que 
además existe cierta relación entre grupos de objetos. Es decir, la relación “mayor que” 
es válida para todos los pares de objeto de diferente clase. 

Se obtiene una escala ordinal “natural” cuando los datos originales admiten una 
relación “más grande que” para todos los pares de unidades. Los numerales asignados a 
los objetos rangueados son llamados valores de rango. Ejemplo: autoridad militar 
(capitán, teniente, sargento, etc.), distribución de poder o de prestigio, status 
socioeconómico (alto, medio, bajo). 


C) Nivel intervalar 


En las dos escalas examinadas más arriba, los elementos del sistema eran clases de 
objetos y las relaciones se reducían a igualdad o más grande que. Ninguno de los dos 
niveles especificaba distancia entre clases, es decir que cuando hablábamos de que 4 era 
mayor que B, y que B era mayor que C, no podíamos hacer ninguna afirmación sobre si 
la distancia que separaba 4 de B era mayor, igual, más o menos importante y cuán 
intensa, que la que separaba B de C. En lo que se refiere a distancia que separa objetos o 
clases de objetos tanto el nivel nominal como el ordinal son nominales. 

En una escala intervalar podemos afirmar no solamente que tres objetos o clases а, b, 
с, están en una relación а> b > с, sino también que en los intervalos que separan los 
objetos se da la relación ab > ij о ij > ab. 

Es decir que es una escala o nivel que está caracterizado por un orden simple de los 
estímulos sobre la escala, y por un orden en los tamaños que miden las distancias en los 
estímulos adyacentes sobre la escala. Los datos contienen especificaciones relativas al 
tamaño exacto de los intervalos que separan a todos los objetos en la escala, además de 
las propiedades que se obtienen en la escala nominal y ordinal. Aquí estamos realmente 
a nivel de lo que entendemos por “cuantificación” propiamente tal y se requiere el 
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establecimiento de algún tipo de unidad física de medición que sirva como norma, y que 
por lo tanto pueda aplicarse indefinidamente con los mismos resultados. 

La escala de intervalos supone la adjudicación de un cero arbitrario, y las operaciones 
aritméticas se aplican sobre las diferencias entre los valores de la escala. Ejemplos: 
temperatura, tests de ГО, etcétera. 


D) Nivel por cociente o racional 


Supone un 0 absoluto y es posible cuando existen operaciones para determinar cuatro 
tipos de relaciones: 1) Similitud. 2) Ordenación de rangos. 3) Igualdad de intervalos. 4) 
Igualdad de proporciones (razones o cocientes). 

Una vez determinada la igualdad por cociente, los valores numéricos pueden 
transformarse con sólo multiplicar cada valor por una constante. Con este tipo de escala 
es posible realizar todo tipo de operaciones aritméticas. Ejemplo: distancia, peso, 
volumen, etcétera. 


PROGRAMA ESTADÍSTICO DEL SPSS 


El sPss contiene programas estadísticos para: a) Estadística descriptiva y distribución de 
frecuencia para una variable. b) Tabla de contingencia y tabulaciones cruzadas. c) 
Correlaciones bivariatas. 4) Correlaciones parciales. e) Regresiones múltiples. /) Análisis 
de la varianza. g) Análisis discriminatorio. Л) Análisis factorial. i) Análisis de 
correlaciones canónicas. /) Análisis de escalograma, para escalas Guttman. 

Y una serie de subrutinas, para modelos lineares en análisis de regresiones, como 
regresiones con variables mudas (Dummy variables) y Path análisis. Nosotros trataremos 
de especificar para qué sirven cada uno de estos subprogramas dando algunos detalles 
sobre las condiciones para su utilización. 


ESTADÍSTICA DESCRIPTIVA 


A) Medidas de tendencia central 


Incluye solamente la media aritmética, la mediana y el modo. Estos promedios indican 
los valores centrales de observaciones. Sirven para: describir en forma sintética el 
conjunto de datos; los promedios provenientes de muestras pueden ser utilizados como 
una buena estimación de los valores parámetros, existiendo para ello una serie de 
técnicas de estimación a partir de valores muestrales que serán examinadas en la parte 
correspondiente a estadística inferencial. 

La media aritmética es lo que conocemos familiarmente como promedio, esto es, el 
resultado de dividir la suma total de todas las mediciones por la cantidad total de casos. 
La mediana es el punto en la distribución que la divide en dos partes iguales, esto es, por 
encima de la mediana se encuentra el 50% de los casos y por debajo el otro 50%. El 
modo es el punto en la distribución que registra la frecuencia máxima. La media 
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aritmética es la más exacta y confiable de las tres medidas. 


Empleo de media, mediana y modo 


El nivel de medición apropiado para cada uno de los niveles es: 


HOIDA AAA алдага ... modo 
ordmal озан 10 aa парола .. modo, mediana 
intervalar o racional .......... . . modo, mediana, media 


Existen algunos casos en los cuales, además del nivel de medición apropiado, es 
necesario tener en cuenta la forma de la distribución de los datos. 

En síntesis, se computa la media aritmética cuando: a) Los datos están medidos a 
nivel intervalar al menos. b) Cuando la distribución es simétrica, aproximadamente 
normal y unimodal. c) Cuando se van a efectuar cálculos posteriores. 

La mediana cuando: а) Los datos están medidos a nivel ordinal al menos. b) Cuando 
se cuenta con distribuciones incompletas. c) Cuando la distribución es necesariamente 
asimétrica. 

El modo cuando: a) La escala es nominal. b) Cuando se desea conocer el caso más 
típico. 


B) Medidas de variabilidad o de dispersión 


Las medidas de tendencia central por sí solas constituyen una información valiosa, pero 
insuficiente para un análisis de la distribución, necesitando el complemento de lo que se 
conoce como medidas de variabilidad o de dispersión. Estas medidas indican cómo se 
distribuyen los valores alrededor de las medidas de tendencia central. Las medidas de 
variabilidad más importantes son: 

Amplitud total (range), que denota simplemente la diferencia entre los valores 
máximo y mínimo de la distribución. 

La amplitud semi-intercuartil (Q), que es la mitad de la amplitud de 50% central de 
casos. 

La desviación media (AD) es la media aritmética de todos los desvíos con relación al 
promedio, cuando no se toman en consideración los signos algebraicos. 

La desviación estándar (sigma, о), que es un desvío cuadrático medio, o en términos 
operacionales la raíz cuadrada de la media aritmética del cuadrado de las desviaciones de 
cada una de las medidas en relación al promedio aritmético. 

Cada una de estas medidas de variabilidad complementa la información de las 
medidas de tendencia central. Por ejemplo: 
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Medida de tendencia central Medida de variabilidad 


Modo Amplitud total 
Mediana Amplitud semiintercuartil 
Media Desviación media-desviación estándar 


Los valores provenientes de la amplitud total son útiles para tener una idea general 
del rango de variación en los datos; sin embargo, es poco confiable en la medida en que 
para su cálculo solamente se utilizan dos valores extremos, por lo cual es imprecisa. 

La amplitud semiintercuartil, complemento de la mediana, es útil como índice de la 
simetría de la distribución total. En distribuciones perfectamente simétricas el cuartil 1 
(Оу) y el cuartil 3 (Q2) están a igual distancia del centro de la distribución o mediana 


(Оз). Si las distancias son desiguales hay asimetría. En resumen: 


Asimetría positiva cuando: (О, – Q») > (0„— О,) 
Asimetría negativa cuando: (0, – Q») < (Q, — О,) 
Asimetría cero cuando: (Qs — Q2) = (О, — Qı) 


La desviación media nos informa sobre la magnitud de las desviaciones respecto a la 
media. Cuando la distribución es normal, aproximadamente 58% de las observaciones 
caen en el espacio comprendido entre la media aritmética más una desviación media y la 
media aritmética menos una desviación media. 

La desviación estándar es la medida de variabilidad más exacta y confiable y la más 
empleada en cálculos posteriores (correlación, varianza, etc.). La interpretación más 
común de la desviación estándar es idéntica a la que realizamos con la desviación media, 
esto es, en términos de distribución normal; sumando y restando a la media aritmética 
una desviación estándar debe esperarse que el 68.26% de todos los casos caiga en esa 
área de la curva. De esta manera podemos estimar para una distribución cualquiera 
cuánto se acerca o se aleja de una distribución normal. Cuando la distribución es muy 
asimétrica el cálculo de la desviación estándar no es conveniente, recomendándose más 
el cálculo de desviación media o desviación intercuartil. 

El sPss contiene además una serie de medidas рага la determinación de la forma de la 
distribución como la curtosis (kurtosis) y la oblicuidad (skewness). 

La oblicuidad es un estadístico que indica el grado en que la distribución se aproxima 
a la distribución normal. Cuando la distribución es completamente simétrica, la 
oblicuidad es igual a 0. Los valores positivos indican que los casos se concentran más a 
la izquierda de la media, mientras que los valores extremos, a su derecha. Los valores 
negativos se interpretan exactamente al revés. Se aplica únicamente cuando los datos 
están a nivel intervalar al menos. 

La curtosis es una medida relativa a la forma de la distribución (mesocúrtica о 
platicúrtica). La curtosis en una distribución normal es cero. La curtosis es positiva 
cuando la distribución es estrecha y en forma de pico, mientras que los valores negativos 
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indican una curva aplanada. 

El cálculo de estadística descriptiva en el SPSS está contenido en dos subprogramas: 
condescriptive y frecuencies. El subprograma condescriptive en variables continuas a 
nivel intervalar. El subprograma frecuencies trabaja con variables discretas, por 
consiguiente se corresponde a los niveles nominales y ordinales. 

El investigador debe tener cuidado en la selección de los valores que aparecen en las 
descripciones sumarias en las hojas del out-put de la computadora, con el fin de 
seleccionar solamente aquellos estadísticos que se corresponden con la naturaleza de sus 
datos. 


CONFIABILIDAD DE LOS ESTADÍSTICOS 


Las características de las poblaciones (o universos) son denominados valores 
parámetros. Qué es una población, desde el punto de vista estadístico, es una materia de 
definición arbitraria, aunque en un sentido general puede definirse como el conjunto 
total de unidades (individuos, objetos, reacciones, etc.) que pueden ser delimitados 
claramente por la posesión de un atributo o cualidad propio y único. Muestra es 
cualquier subconjunto de ese conjunto mayor que constituye la población. Téngase bien 
claro entonces que dos muestras pueden considerarse como proveniendo de la misma 
población o de dos poblaciones diferentes, en relación a un solo aspecto (por ejemplo, 
coeficiente intelectual, actitud frente al cambio, etcétera). 

Gran parte de las investigaciones en ciencias sociales se basan en estudio de muestras, 
y a partir de ellas se desea estimar o inducir las características de la población o 
universo. 

El error estándar nos da una estimación de la discrepancia de las estadísticas 
muestrales con relación a los valores de la población. Si pretendemos utilizar el 
estadístico muestral como una estimación de los valores parámetros, cualquier 
desviación de la media muestral sobre la media parámetro puede considerarse como un 
error. 

El error estándar de la media aritmética nos dice cuál es la magnitud del error de 
estimación para la media aritmética. El error estándar de la media es el desvío estándar 
de la distribución de las medias muestrales provenientes de una misma población. El 
error estándar de la media es directamente proporcional al tamaño de su desviación 
estándar e indirectamente proporcional al tamaño de la muestra. La interpretación del 
error estándar de una media se realiza en términos de distribuciones normales; esto es, la 
finalidad es determinar en qué medida las medias aritméticas de muestras similares a la 
que estamos considerando se alejan o aproximan a la media de la población. Cuanto 
menor sea el valor del error estándar tanto mayor será la fiabilidad de nuestra media 
como estimación de la media de la población. En general, la probabilidad de error se fija 
con valores de .05 y .01, es decir que la probabilidad de error aceptada es de 5 sobre 100 
o de 1 sobre 100, de ahí que la estimación de los parámetros se haga en intervalos de 
confianza, donde a la media muestral le agregó y le disminuyó tantos valores de error 
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estándar como para cubrir 95% del total de casos, o el 99%. 
La fórmula genérica para la determinación de intervalos de confianza es: 


Para 05 :M ж 1,96 Oy 
Para 01 M ж 2,58 Oy 


Para la distribución de probabilidades distintas de .05 y .01, simplemente se buscan 
en la tabla de curva de distribución normal los valores correspondientes. 

Las interpretaciones señaladas tanto para la media aritmética como para el resto de los 
estadísticos son posibles únicamente cuando las muestras son aleatorias. 

El cálculo del error estándar de la media está contenido en el subprograma 
condescriptive. 

Confiabilidad de la mediana. Se interpreta de la misma forma que el error estándar de 
la media, y en poblaciones normalmente distribuidas, el error estándar de la mediana da 
una variabilidad aproximadamente de 25% mayor que el de las medias. 

Error estándar de desviación estándar, Q, proporciones, porcentajes, frecuencias. 
Las fórmulas para su cálculo difieren, pero la interpretación es idéntica a la realizada 
más arriba, esto es, en términos de estimación de valores parámetros por medio de 
intervalos de confianza. 

Confiabilidad de un coeficiente de correlación. Lo mismo que los demás estadísticos, 
un coeficiente de correlación está sujeto a los errores de muestreo. La variabilidad 
entonces estará en función del tamaño del error estándar del coeficiente. Sin embargo, la 
distribución de los coeficientes obtenidos no será uniforme, ya que dependerá de la 
magnitud de r, así como el número de observaciones que componen la muestra. En la 
medida en que los coeficientes varían entre + 1.00 y — 1.00 cuando la r parámetro se 
aproxima a esos valores extremos, la distribución será más asimétrica; negativamente 
asimétrica para los valores positivos de r y positivamente asimétrica para los valores 
negativos de r. Solamente en el caso en que el r parámetro sea 0, entonces la distribución 
de las r muestrales será normal. 

Para muestras grandes el problema de la asimetría carece de importancia significativa; 
cuanto más grande la muestra, menor será la dispersión de las ғ, de ahí que, aun cuando r 
es cero, en muestras menores de 25 casos sea necesario tener alguna precaución en las 
estimaciones. Cuando r es grande y la muestra es grande, el error estándar del 
coeficiente será mínimo. 


CONFIABILIDAD DE DIFERENCIA ENTRE ESTADÍSTICOS 
(SUBPROGRAMA BREAKDOWN) 


El subprograma breakdown calcula e imprime las sumas, medias, desviaciones estándar 
y varianza de la variable pendiente en los distintos subgrupos que la componen, según 
clasificaciones complejas que incluyan de 1 a 5 variables independientes, cualquiera que 
sea el nivel de medición (en las variables independientes, la variable dependiente debe 
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ser medida a nivel intervalar). 

Antes de desarrollar las alternativas del subprograma de breakdown conviene 
introducir conceptualmente la idea de confiabilidad de la diferencia entre estadísticos. 

Para la investigación es importante no solamente estimar los valores poblacionales, 
sino utilizar el error estándar para interpretar varios resultados, en lo relativo a las 
diferencias que pueden existir entre ellos. 

El tipo de preguntas que nos planteamos aquí es: ¿Cuál es la fiabilidad de la 
diferencia entre medias proporciones, etc., que hemos registrado en nuestras 
observaciones? ¿Son los hombres o las mujeres más capaces en comprensión verbal? ¿El 
rendimiento intelectual en las clases medias es superior, inferior o igual al rendimiento 
intelectual en las clases bajas?, etcétera. 


A) Error estándar de la diferencia de medias (Subprograma T-Test) 


La magnitud de la oscilación en la diferencia entre medias obtenidas de muestras 
distintas dependerá naturalmente de la magnitud de la oscilación que es propia de las 
medias. La estabilidad de las medias estará representada por sus respectivos errores 
estándares. 

Cuando las № son lo suficientemente grandes, las medias oscilan alrededor de un 
valor central (parámetro que por lo general no conocemos). Nuestra finalidad es entonces 
determinar primero $1 existe diferencia, para luego definir su magnitud. 

El problema reside entonces en determinar si la diferencia que se examina entre las 
dos medias muestrales implica además una diferencia en la distribución de la población; 
en otras palabras, si la diferencia es la expresión de diferencias reales a niveles 
poblacionales, o se deben simplemente a los efectos del azar (y por consiguiente del 
error) en las muestras. 

El test T de student nos ayuda a establecer cuándo la diferencia entre dos medias es 
significativa. Para ello se formula una hipótesis nula. Una hipótesis nula supone que las 
dos muestras provienen de la misma población; consecuentemente las desviaciones son 
interpretadas como debidas al efecto del azar sobre las muestras. Según la hipótesis nula 
se supone que la distribución de las diferencias es normal, de donde M; – М, = 0. 


El nivel de significación para la aceptación o rechazo de la hipótesis nula es 
seleccionado por el investigador. Los más comunes son de .05 y .01 aunque esto 
depende más bien del área que se está investigando (para aceptar o rechazar una vacuna 
nueva que cure el cáncer puedo elegir un nivel menor; cuando se trata de la introducción 
de una medicina para suplantar alguna en uso con cierto grado de eficacia, elegiré un 
nivel de significación mayor). 

El valor de £ nos informará entonces sobre la probabilidad o improbabilidad para la 
aceptación o rechazo de la hipótesis nula, o de alguna hipótesis alternativa. Es decir, no 
se afirma que no existe una diferencia en los resultados, sino únicamente que la 
diferencia es, o no es, significativa. 

El subprograma T-Test computa los valores £ y sus niveles de probabilidad para dos 
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tipos de casos: a) Muestras independientes o error estándar de la diferencia para medias 
no correlacionadas, es decir, para situaciones en las que las dos series de observaciones 
son independientes. Por ejemplo, comparación del rendimiento de hombres y mujeres en 
una situación de test. b) Muestras apareadas o error estándar de la diferencia para 
medias correlacionadas. El ejemplo típico es el de las mediciones antes-después en 
diseños experimentales. 

Existen casos en los cuales el investigador no plantea la hipótesis nula (la hipótesis de 
las no-diferencias), sino que plantea una hipótesis alternativa, en la que trata de 
demostrar que la media en un grupo es más grande que la media del otro. En estos casos 
la interpretación del valor t obtenido se hace a partir de lo que se llama test de una sola 
cola, es decir, se toma en cuenta solamente una mitad de la distribución. 


TABLAS DE CONTINGENCIA Y MEDIDAS DE ASOCIACIÓN 
(SUBPROGRAMA CROSSTABS) 


Este subprograma contiene tanto tabulaciones cruzadas para tablas de n x k como una 
serie de medidas de correlación, asociación y confiabilidad de la diferencia entre 
estadísticos. Comenzaremos por los análisis de tipo más sencillo para continuar luego 
con los cálculos de medidas más complejas. 


Tabulaciones cruzadas 


Una tabulación cruzada es simplemente la combinación de dos o más variables discretas 
o clasificatorias en la forma de tabla de distribuciones de frecuencia. El cuadro resultante 
puede ser sometido a análisis estadístico, en términos de distribuciones porcentuales, 
aplicación de test de significación, coeficientes de asociación y de correlación, etcétera. 

Las tablas cruzadas son muy utilizadas en análisis de encuestas, en tablas de 2 x 2 o 
con la introducción de variables de prueba o de control o intervinientes, constituyendo 
así tablas de n x k. Aquí el investigador debe tener especial cuidado cuando solicita 
tablas de n x k de que el tamaño de su muestra sea lo suficiente grande para permitir que 
cada uno de los casilleros contenga las frecuencias esperadas. 

De todos modos existe una serie de restricciones al uso de los distintos estadísticos 
que señalaremos más adelante y que imponen algunas limitaciones en cuanto a la 
cantidad total de casilleros, ya sea por cantidad de variables o por cortes en cada una de 
ellas. Por ejemplo: el investigador debe recordar que, si combina, digamos, 4 variables, 
todas dicotomizadas, la cantidad total de casilleros será de 16; si las variables estuvieran 
tricotomizadas la cantidad de casilleros ascendería а 81. La fórmula genérica para el 
cálculo del tamaño final de la matriz es: 


М = үр. Рә. з РАЯ Fn 
donde: 
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г = Cantidad de cortes o divisiones en cada una de las variables 
М = Tamaño de la matriz de datos 


Es de recordar que en este tipo de cuadros hay que esperar un promedio de 10 a 20 
casos en cada uno de los casilleros, lo que hace que las muestras deben tener tamaños 
considerables cuando se desea cuadros muy complejos. 

Normalmente los cuadros imprimen tanto las frecuencias dentro de cada casillero o 
celda como los porcentajes con respecto al marginal horizontal y al marginal vertical y al 
total general (en ese orden), además de todos los coeficientes que incluye la subrutina y 
que a continuación pasamos a detallar. 


Ji cuadrado (7 ) 


Es un modelo matemático o test para el cálculo de la confiabilidad o significado de 
diferencias entre frecuencias esperadas (fẹ) y frecuencias observadas (fọ). La utilidad de 
este test no-paramétrico para variables nominales reside en su aplicación para prueba de 
hipótesis para tres tipos de situaciones: 

a) Prueba de hipótesis referidas al grado de discrepancia entre frecuencias observadas 
y frecuencias esperadas, cuando se trabaja sobre la base de principios apriorísticos. 

b) Pruebas de hipótesis referidas a la ausencia de relación entre dos variables. Se trata 
de pruebas de independencia estadística y son trabajadas en base a cuadros de 
contingencia. 

с) Pruebas referidas a la bondad de ajuste. En este caso se trata de comprobar si es 
razonable aceptar que la distribución empírica dada (datos observados) se ajusta a una 
distribución teórica, por ejemplo, binomial, normal, Poisson, etc. (datos esperados). 


Supuestos y requisitos generales 


a) Las observaciones deben ser independientes entre sí. b) Los sucesos deben ser 
mutuamente excluyentes. с) Las probabilidades que figuran en las tablas de y? están 
basadas en una distribución continua, mientras que el y? calculado en la práctica lo está 
en base a variables discretas. Se supone que esta última puede aproximarse a la primera. 
d) El nivel de medición mínimo es nominal. e) Las frecuencias esperadas mínimas por 
casillero deben ser 5, cuando esto no se cumple es necesario aplicar un factor de 
corrección (corrección de Yates). f) La prueba de Y es útil solamente para decidir 
cuándo las variables son independientes o relacionadas. No nos informa acerca de la 
intensidad de la relación, debido a que el tamaño de la muestra y el tamaño del cuadro 
ejercen una influencia muy fuerte sobre los valores del test. Existen numerosos 
estadísticos basados en la distribución de Y que son útiles para la determinación de la 
intensidad de la relación (ver coeficiente Fi, Cramer, C, etcétera). 


Coeficiente fi (Фф) 
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Es una medida de asociación (fuerza de la relación) para tablas de 2x2. Toma el valor 
cero cuando no existe relación, y el valor + 1.00 cuando las variables están 
perfectamente relacionadas. 


Coeficiente V. de Cramer 


Es una versión ajustada del coeficiente ф para tablas de r x k. El nivel de medición es 
nominal y el coeficiente varía entre 0 y 1.00. 


Coeficiente de contingencia (С) 


Basado como los dos anteriores en Y se pueden utilizar matrices de cualquier tamaño. 
Tiene un valor mínimo de 0, y sus valores máximos varían según el tamaño de la matriz 
(por ejemplo, para matrices de 2 x 2 el valor máximo de C es .707; en tablas de 3 x 3 es 


ГЕ 1 

.816, etc., la fórmula genérica: Y 7) consecuentemente para una interpretación del 

coeficiente obtenido en cualquier tabla de 2 x 2 habría que dividir ese valor entre .707. 
Limitaciones: a) El límite superior del coeficiente está en función del número de 

categorías; b) dos o más coeficientes C no son comparables, a no ser que provengan de 

matrices de igual tamaño. 


El coeficiente Q de Yule 


También como los anteriores para escalas nominales, se utiliza únicamente en tablas de 2 
х 2. Los valores O son 0 cuando hay independencia entre las variables, siendo sus 
límites + 1.00 cuando cualquiera de las 4 celdas en el cuadro contiene 0 frecuencias: en 
general, cuál de los distintos coeficientes es preferible en este caso (Ф о О) depende del 
tipo de investigación y del tipo de distribución marginal. 


Coeficiente lambda (4) 


Es un coeficiente de asociación para tablas de r x k, cuando las dos variables están 
medidas a nivel nominal. 

El coeficiente lambda pertenece a la familia de un grupo de coeficientes (tp, A y 
otros), que se utilizan para hacer interpretaciones probabilísticas en cuadros de 
contingencia. El tamaño del coeficiente indica la reducción proporcional en errores de 
estimación en la variable dependiente cuando los valores en la variable independiente 
son conocidos. 

El valor máximo de А es 1.00 у ocurre cuando las predicciones pueden hacerse sin 
ningún error. Un valor cero significa que no hay posibilidad de mejorar la predicción. Un 
coeficiente lambda .50 significa que podemos reducir el número de errores a la mitad, 
etcétera. 
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Coeficiente ть de Goodman y Kruskal 


Sirve a los mismos propósitos que el coeficiente lambda y debe preferirse cuando los 
marginales totales no son de la misma magnitud. 


Coeficiente de incertidumbre 


También para niveles nominales en cuadros de contingencia de r х k. La computación 
del coeficiente toma en cuenta simetría y asimetría (el coeficiente lambda toma en 
cuenta, por ejemplo, solamente la asimetría). El coeficiente asimétrico es la proporción 
de reducción de la incertidumbre conocido por efecto del conocimiento de la variable 
independiente. La ventaja de este coeficiente sobre lambda es que considera el total de la 
distribución y no solamente el modo. 

El máximo valor del coeficiente de incertidumbre es 1.00 que denota la eliminación 
de la incertidumbre, y se alcanza cada vez que cada categoría de la variable 
independiente está asociada solamente a una de las categorías de la variable dependiente. 
Cuando no es posible lograr ningún avance en términos de disminución de la 
incertidumbre, el valor del coeficiente es 0. Una versión simétrica del coeficiente mide la 
reducción proporcional en incertidumbre que se gana conociendo la distribución 
conjunta de casos. 


Coeficiente tau b 


Mide la asociación entre dos variables ordinales en cuadros de contingencia. Este 
coeficiente es apropiado para cuadros cuadrados (es decir, donde el número de columnas 
es idéntico al número de filas). Sus valores varían de 0 a + 1.00. El valor cero indica que 
no existe asociación entre pares concordantes y discordantes. El valor + 1.00 se obtiene 
cuando todos los casos se ubican a lo largo de la diagonal mayor. En tablas de 2 x 2 el 
valor de tau b es idéntico al de ф con la ventaja de que el coeficiente tau b proporciona 
información sobre la dirección de la relación a través del signo. Los valores negativos 
indican que los casos se distribuyen sobre la diagonal menor. Los valores intermedios 
entre 0 y 1 indican casos que se desvían de las diagonales. A mayor desviación mayor 
proximidad al valor cero (es decir, cuando los pares discordantes son iguales a los pares 
concordantes). 


Coeficiente tau c 


Sirve a los mismos propósitos que el coeficiente tau b, pero este coeficiente es más 
apropiado para cuadros rectangulares (cuando el número de columnas difiere del número 
de líneas). La interpretación de ambos coeficientes es similar. 


Coeficiente gamma (y) 


Mide asociación entre dos variables ordinales en cuadros de contingencia de r х k. 
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Mientras que el coeficiente tau с depende para su cómputo solamente del número de 
líneas y de columnas, y no de las distribuciones marginales, tomando en cuenta los 
empates, el coeficiente gamma excluye los empates del denominador de la fórmula de 
cómputo, siendo además un coeficiente con posibilidades de aplicación en datos no 
agrupados. Además, el coeficiente no requiere cambios en la forma de la matriz. Los 
valores numéricos de gamma por lo general son más altos que los valores de tau b y de 
tau с. 

El coeficiente gamma es simplemente el resultado del número de pares concordantes 
menos el número de pares discordantes, divididos por el número total de pares unidos. 
Los valores gamma varían entre 0 y + 1.00, donde el signo indica la dirección de la 
relación y los valores la intensidad de la misma. 

El sPss provee valores gamma para cuadros de tres a n entradas, en el que se calcula 
el gamma de orden cero y además gammas parciales. El gamma de orden cero mide la 
relación entre dos variables, siendo exactamente el mismo que se discute en los párrafos 
anteriores. Cuando la matriz tiene tres o más dimensiones, el sPss (subprograma 
crosstabs) computa un coeficiente gamma de orden cero (reduciendo la tabla a variable 
dependiente e independiente) y, además, medidas de correlación parcial gamma de la 
relación entre las dos variables, controladas por una o más variables adicionales. El 
investigador puede analizar así cómo influye en la relación de sus variables dependiente 
e independiente la introducción de variables adicionales (en la sección correspondiente a 
correlaciones parciales indicaremos con mayor detalle el uso y significado de las 
correlaciones parciales). 


Coeficiente D de Sommer 


Para variables ordinales en cuadros de contingencia, este coeficiente toma en cuenta los 
empates, pero el ajuste es realizado de manera distinta de la utilizada en los coeficientes 
tau b y tau с. 


Coeficiente eta (n) 


Se utiliza cuando la variable independiente es nominal y la variable dependiente 
intervalar. Este coeficiente indica cuán disimilares son las medias aritméticas en la 
variable dependiente dentro de las categorías establecidas por la variable independiente. 
Cuando las medias son idénticas el valor del coeficiente es 0. Si las medias son muy 
diferentes y sus varianzas son pequeñas, los valores de eta se aproximan a 1.00. 


Correlación biserial (ty) 


Para utilizar cuando una de las variables está medida a nivel nominal y la otra a nivel 
intervalar, la variable a nivel nominal puede ser una dicotomía forzada. Sus valores 
oscilan entre 0 y + 1.00. 
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Correlación punto-biserial (тр) 


Similar al coeficiente biserial, se aplica cuando la variable nominal es una dicotomía 
real. La interpretación de ambos coeficientes es idéntica y su utilización más común se 
encuentra en la construcción de pruebas, sobre todo para la determinación de validez. 


Coeficiente de correlación Spearman (p) 


Es un coeficiente de correlación por rangos, cuando las dos variables están medidas a 
nivel ordinal, e indica el grado en que la variación o cambio en los rangos de una de las 
variables está relacionado con las variaciones o cambios en los rangos en la otra 
variable. Tanto el coeficiente р (rho) de Spearman como el coeficiente т (tau) de Kendall 
son coeficientes no paramétricos, es decir que no se hacen supuestos acerca de la 
distribución de los casos sobre las variables. Ambos coeficientes suponen la no 
existencia de muchos empates, por lo cual los sistemas de organización de los datos y de 
cómputo son distintos de los de las tabulaciones cruzadas, y por ello se encuentran en 
subprogramas diferentes (en este caso el subprograma correspondiente en el SPSS es 
denominado nonpar corr). 

Para el cómputo del coeficiente correlación р de Spearman (así como para el т de 
Kendall) no se toman en consideración los valores absolutos en las variables, sino su 
orden de rango. El coeficiente rho de Spearman se aproxima más que el coeficiente tau 
de Kendall al coeficiente de correlación producto-momento de Pearson, cuando los datos 
son aproximadamente continuos. Los valores del coeficiente varían entre —1.00 y 
+1.00. 


Coeficiente de correlación tau de Kendall (т) 


Similar al coeficiente rho, se utiliza cuando las dos variantes son ordinales. Por lo 
general debe preferirse cuando existe abundante número de empates entre rangos, lo que 
se da especialmente cuando el número total de casos es grande y se clasifican en un 
número relativamente pequeño de categorías. El subprograma nonpar corr contiene 
factores de corrección para empates tanto para el coeficiente tau como para el coeficiente 
rho. Los valores de este coeficiente oscilan entre —1.00 y +1.00. 


Coeficiente de correlación producto-momento de Pearson (т) 


Para dos variables medidas a nivel intervalar por lo menos, éste es un coeficiente de 
correlación paramétrico que nos indica con la mayor precisión cuándo dos cosas están 
correlacionadas; es decir, hasta qué punto una variación en una se corresponde con una 
variación en otra. Sus valores varían de +1.00, que quiere decir correlación positiva 
perfecta, a través de 0, que quiere decir independencia completa o ausencia de 
correlación, hasta —1.00, que significa correlación perfecta negativa. El signo indica por 
lo tanto la dirección de la covariación y la cifra, la intensidad de la misma. Una 
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correlación perfecta de +1.00 indica que, cuando una variable se “mueve” en una 
dirección, la otra se mueve en la misma dirección y con la misma intensidad. La 
interpretación de la magnitud de r depende en buena medida del uso que se quiera dar 
del coeficiente, el grado de avance teórico en el área, etc. Guilford! sugiere como 
orientación general la siguiente interpretación descriptiva de los coeficientes de 
correlación producto-momento: 


r menor que .20 — correlación leve, casi insignificante 

г де .20 a .40 — baja correlación, definida, pero baja 
r de .40 a .70 — correlación moderada, sustancial 

r de .70 a .90 — correlación marcada, alta 

r de .90 a 1.00 — correlación altísima, muy significativa 


De todos modos, la interpretación del coeficiente está además condicionada a su 
grado de significación (ver significación de los estadísticos). 

Premisas o suposiciones fundamentales para el cómputo de r: a) Ambas variables 
deben ser medidas a nivel intervalar al menos. b) La dirección de la relación debe ser 
rectilínea. c) La distribución tiene que ser homoscedástica (las dispersiones en las 
columnas y en las líneas del diagrama de dispersión deben ser similares). Esta condición 
prevalece cuando las dos distribuciones son simétricas entre ellas. 

El programa imprime el valor del coeficiente de correlación, la cantidad de casos y la 
significación estadística. 

Existen varios coeficientes que se derivan del coeficiente de correlación producto- 
momento, entre otros, por ejemplo: 7?: mide la proporción de la varianza en una variable 
que es “explicada” por la otra. 


Diagrama de dispersión (Scattergram) 


El spss puede imprimir, además, a través de su subprograma Scattergram, el diagrama 
de dispersión para dos variables, computando además la regresión linear simple. El 
diagrama de dispersión es un tráfico de puntos donde, basado en los valores en las dos 
variables, una de las variables define el eje horizontal y la otra el eje vertical. Estos 
diagramas son de mucha utilidad, ya que nos dan una imagen de la relación, que puede 
ser utilizada para la determinación de la homocedasticidad, por ejemplo, y para decidir si 
vale o no la pena continuar más adelante. 

Para la confección de los diagramas, el usuario tiene que tomar algunas decisiones 
sobre cómo va a manejar la falta de datos (missing data), qué clase de escala tiene que 
utilizar y cómo colocará las líneas segmentadas. 

Comúnmente, dos líneas verticales y dos líneas horizontales segmentadas dividen 
cada eje con tres secciones, de manera que el gráfico consta de 9 rectángulos iguales. Si 
el investigador prefiere, las líneas segmentadas pueden ser diagonales que atraviesan el 
gráfico. 
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Los datos (es decir, cada punto sobre el diagrama) están representados por asteriscos 
(*) cuando un caso cae en alguna intersección, de dos a ocho casos el número es 
impreso. Nueve o más casos están representados por el número 9. Cuando la escala 
contiene muy pocas categorías, existe la posibilidad de que los puntos sobre el diagrama 
se den muy amontonados, lo que limita la utilización del diagrama de dispersión 
recomendándose para esas situaciones una tabulación cruzada. 

Los estadísticos que acompañan al diagrama de dispersión son aquellos asociados a 
las regresiones lineares simples: correlación producto-momento, error estándar de la 


estimación, 22, significación de la correlación, intersección con el eje vertical, e 
inclinación. 

Es necesario discutir con algún detalle el concepto de regresión, ya que sirve de base 
para la utilización de predicciones, así como de ayuda para la comprensión del concepto 
de correlaciones parciales y múltiples. 

El concepto de regresión trata de describir no solamente el grado de relación entre dos 
variables, sino la naturaleza misma de la relación, de manera que podamos predecir una 
variable conociendo la otra (por ejemplo, el rendimiento académico a partir del resultado 
en un test, el ingreso a partir de la educación, etc.). Aquí no estamos interesados en 
explicar por qué las variables se relacionan como se relacionan, sino simplemente, a 
partir de la relación dada, predecir una variable a partir del conocimiento de los valores 
en la otra. Si la variable X es independiente de la variable Y (es decir, si son 
estadísticamente independientes), no estamos en condiciones de predecir Y a partir de X 
о viceversa, es decir, nuestro conocimiento de X no mejora nuestra predicción de Y. Por 
razonamiento inverso, cuando las variables son dependientes —están correlacionadas, 
со-уагіап—, el conocimiento de X nos puede ayudar a predecir el comportamiento de Y 
y Viceversa. 

Esto se logra mediante lo que se llama ecuación de regresión de Y sobre X, que nos da 
la forma en cómo las medias aritméticas de los valores de Y se distribuyen según valores 
dados de X. 

La operación de regresión contiene los siguientes supuestos: a) Que la forma de la 
ecuación es linear. b) Que la distribución de los valores de Y sobre cada valor de X es 
normal. c) Que las varianzas de las distribuciones de Y son similares para cada valor de 
X. а) Que el error es igual a 0. 

Cumplidas estas condiciones, la ecuación de la regresión es: 


Y=a+pX 


donde a y В son constantes y se les da una interpretación geométrica. 

Si X es igual a 0, entonces Y = а. 

a representa entonces el punto donde la línea de regresión cruza el eje de Y. 

La inclinación de la línea de regresión es dada por В, indicando la magnitud en el 
cambio de Y рог cada unidad de cambio en X. Cuando В es igual a 1, y si las unidades de 
X y Y están indicadas por distancias idénticas a lo largo de sus ejes respectivos, la línea 
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de regresión estará еп un ángulo de 45° con respecto al eje de las X. А más grande el 
tamaño de В, mayor será el declive, es decir, más grande el cambio en Y dados 
determinados valores de cambio en X. 

H. Blalock ? presenta la siguiente figura que aclara la interpretación geométrica del 
coeficiente de regresión: 


FIGURA 1 
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Es decir que |В mide la tangente del ángulo, con lo cual quéda identificado el ángulo. 


Correlación parcial 


Todos los coeficientes de correlación y asociación examinados hasta ahora tomaban en 
cuenta la relación entre dos variables (con la excepción del coeficiente gamma). La 
correlación parcial provee medidas del grado de relación entre una variable dependiente 
Y y cualquiera de un conjunto de variables independientes, controladas por una o más de 
esas variables independientes. Es decir, describe la relación entre dos variables, 
controlando los efectos de una o más variables adicionales. 

Es similar a lo que se hace en tabulaciones cruzadas, cuando se introducen variables 
de control. Sin embargo, ya habíamos visto que para controlar varias variables con 
varios valores necesitábamos una muestra demasiado grande, además de que la 
inspección del efecto era de tipo literal. 

Con correlaciones parciales, el control no solamente es estadístico, sino que además 
la cantidad de casos no necesita ser muy grande. 

г-к indica entonces а i y j variable independiente y dependiente (el orden es 
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inmaterial, уа que la correlación entre ij y ji serán idénticas). La variable de control es 


indicada con k.’ 

Desde la perspectiva de la teoría de la regresión, la correlación parcial entre i у j, 
controlando por k, es la correlación entre los residuales de la regresión de і sobre k y de j 
sobre k, permitiéndonos establecer predicciones sobre las variables dependientes e 
independientes a partir del conocimiento del efecto que tiene la variable control sobre 
ellas. 

El coeficiente de correlación parcial puede ser utilizado por el investigador para la 
comprensión y clarificación de las relaciones entre tres o más variables. Por ejemplo, 
puede ser utilizado para la determinación de espureidad, para la localización de variables 
intervinientes, y para la determinación de relaciones causales. 

El coeficiente de correlación parcial para la determinación de espureidad en las 
relaciones: una relación espuria es aquella en la cual la correlación entre una variable X 
y una variable Y es el resultado de los efectos de otra variable (Z) que es el verdadero 
predictor de Y. La correlación es espuria cuando, controlando por Z (esto es, a Z 
constante), los valores de X no varían con los valores de Y. Éste es el caso en que los 
coeficientes de correlación parcial dan valores 0 o próximos a 0. 

Supóngase una relación entre X y Y de .40. Computo un coeficiente de correlación 
parcial гу. y el resultado es .20. Este coeficiente de correlación parcial уа me está 
indicando que la variable Z explica parcialmente la relación original entre X y Y. 
Computo un coeficiente de correlación parcial de segundo orden, en el cual controlo por 
dos variables, Z y W. El coeficiente de correlación parcial es ahora r,,,. ¿yy = .06, es decir 


que la relación desaparece, consecuentemente, la relación original era еѕрипа. 

Para la localización de variables intervinientes, así como para la determinación de 
relaciones causales, el problema es de naturaleza más conceptual, esto es, hay que 
combinar valores de coeficientes de correlación parcial con una serie de supuestos sobre 
las formas de las distribuciones y sobre la intervención de otras variables, además de las 
que se consideran en el modelo. Los supuestos no pueden ser verificados empíricamente 
por el análisis estadístico, sino que van a depender del razonamiento teórico. 

En cualquiera de los siguientes casos, salvo en (e) la correlación parcial r,,., debe ser 
próxima a cero (Y es la variable dependiente, es decir, la que va a ocurrir al final en la 
secuencia temporal); (4) es un caso típico de correlación espuria. La relación entre Ху Y 
se explica en función de las relaciones de X con Z y de Y con Z. (Véase la figura que 
viene a continuación.) 

En el modelo (c) Z actúa como variable interviniente en la relación entre X y Y. La 
correlación parcial también dará 0. Pero hay que tener mucho cuidado en no interpretar 
los modelos (c) y (d) de la misma manera, y la correlación parcial tiene sentido 
solamente para probar que no hay relación entre X y Y, sino cuando interviene Z. El 
modelo (b) es similar, aunque ahora X es interviniente. 
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Ү 
(а) Б) (с) (4) (e) 
En el modelo (a) la relación X con Y y la X con Z son relaciones directas, mientras 


que no se postula relación entre Y y Z. 
En los modelos (a) y (b), la correlación parcial entre X y Z, controlado por Y, debe ser 


Б. м 


0. 

Similarmente, en los modelos (с) у (d), la correlación parcial entre X y Y, controlado 
por Z, debe ser 0. 

Cuando el modelo es (е), la correlación parcial r,,.7 dará valores más altos que la 


correlación entre X y Y. La correlación entre Х у Z será 0. 

El investigador debe informar a los programadores sobre la lista deseada de 
correlaciones parciales, en la que se especifiquen las combinaciones de variables (todas 
las combinaciones posibles o solamente algunas de las combinaciones). Por ejemplo: si 
se presentan variables: ingreso, educación, actitud frente al cambio y religiosidad, o se 
especifican las combinaciones deseadas o se deja que se correlacionen todas con todas 
en n combinaciones. 

La palabra with especifica en el programa la combinación entre variables cuando la 
lista incluye solamente algunas combinaciones. Cuando el programa no incluye with se 
calculan todas las combinaciones posibles. 


ANÁLISIS DE REGRESIONES MÚLTIPLES (SUBPROGRAM REGRESSION) 


Este subprograma es considerablemente más complejo que los anteriores, y puede ser 
utilizado para una variedad bastante grande de análisis de variables múltiples: 
regresiones polinomiales, regresiones mudas (dummy), análisis de la varianza y análisis 
de la covarianza, predicciones, etcétera. 

Por lo general, la regresión múltiple requiere variables medidas a nivel intervalar o 
racional y que las relaciones sean lineares y aditivas. Sin embargo, hay casos especiales 
en los cuales regresores mudos, medidos a nivel nominal, pueden ser incorporados a la 
regresión, relaciones no lineares y no aditivas pueden ser manipuladas, etcétera. 

Existen algunas diferencias entre análisis de correlaciones múltiples y análisis de 
regresiones múltiples, que conviene destacar. 

Los análisis de correlaciones múltiples se utilizan para: a) La evaluación de la medida 
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еп que cada variable predictora o subconjunto de variables contribuye a la explicación de 
los puntajes de un criterio sobre una muestra; o b) Para predecir los puntajes de un 
criterio en una muestra diferente en la cual existe información del mismo grupo de 
variables predictoras. Aquí no estamos interesados tanto en la relación entre la variable 
dependiente y cada una de las variables independientes tomadas separadamente, sino en 
el poder explicativo del conjunto de variables independientes en su totalidad. El 
coeficiente de correlación múltiple es expresado entonces como r¡.2345 si son 4 las 
variables predictoras, о r1 -23 si son dos, etcétera. 

Los modelos para el análisis de regresiones múltiples, a la vez que son más complejos 
en términos de cantidad de operaciones o de derivaciones que a través de ellos se puedan 
realizar, son bastante más simples en términos de los supuestos y condiciones para su 
utilización. 

Por ejemplo, los modelos correlacionales requieren que las variables y los parámetros 
observables tengan una distribución normal conjunta; los modelos de regresión múltiple 
requieren solamente que la distribución de las desviaciones de la función de regresión 
sea normal; no se supone que las variables predictoras provengan de una distribución 
normal multivariata, o a veces requiere que los datos estén contenidos en códigos 
binarios. 

Nosotros vamos a dar algunos ejemplos de prueba de hipótesis a través de análisis de 
regresiones múltiples. El análisis de las regresiones múltiples puede ser utilizado ya sea 
para la descripción de las relaciones entre variables o como instrumento para la 
inferencia estadística. 

Como instrumento descriptivo la regresión múltiple es útil: a) Para encontrar la mejor 
ecuación linear de predicción y para evaluar su eficiencia predictiva; b) Para evaluar la 
contribución de una variable o un conjunto de variables; c) Para encontrar relaciones 
estructurales y proveer explicaciones para relaciones complejas de variables múltiples. 

Habíamos visto que el coeficiente de regresión simple se expresaba en la fórmula: 


Y=a+pX 


Un coeficiente de correlación parcial, dijimos, era una medida de la cantidad de 
variación explicada por una variable independiente, después que las otras variables han 
explicado todo lo que podían. En el coeficiente de correlación múltiple estamos 
interesados en el poder explicativo de un conjunto de variables independientes sobre la 
variación dependiente (r1 .2345). 

Para ambos casos, la ecuación de la regresión toma ahora la siguiente forma: 


Ү= а + В] + BA) + кү + Вх, 


Ésta es la ecuación más simple, у parte de los mismos supuestos delineados рага la 
ecuación de regresión simple. En la medida en que nos movemos en espacios 
multidimensionales, la representación geométrica es imposible. 

Los coeficientes В se interpretan de manera distinta que en el caso de regresiones 
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simples, ya que aquí las inclinaciones son varias, y se obtienen cada una de ellas 
controlando por cada una de las variables independientes remanentes. Manteniendo X> 
en un valor fijo, В; representa la inclinación de la línea de regresión de Y sobre Ху, para 
el caso en que solamente se estén controlando dos variables. Y así sucesivamente. 


Ejemplos 


a) Para encontrar la mejor ecuación linear de predicción y para evaluar la eficiencia 
predictiva. Jae-On Kim y Frank Kohout! presentan el problema de predecir la tolerancia 
política a partir de educación, ocupación e ingreso. A través de técnicas de regresión 
múltiple, el investigador podría estar interesado en determinar el grado de dependencia 
linear de la tolerancia política sobre la base de la educación, la ocupación y el ingreso de 
una persona. Supóngase que la tabla de resultados es la siguiente: 


Correlación múltiple < .5312 
R2 : .2822 
Error estándar : 8604 
Variables independientes B $ par 
Educación .1296 3889 
Ocupación .0089 .1778 
Ingreso 0018 0556 
(Constante A) 2.9889 


A A AA иш A A AA ————Á — 


La interpretación en este caso podría ser la siguiente: /) La cantidad de variación еп 
tolerancia política, explicada por la operación conjunta de educación, ocupación, e 
ingreso, es del 28.22% de la varianza total. 2) Si el investigador está interesado en 
predecir los puntajes que un sujeto va a obtener en tolerancia política a partir de las tres 
variables independientes, aplicará la ecuación de predicción señalada más arriba. 


Y= 2.9889 + .1296 (X1) + .0089 (X2) + .0018 (X3) 


Si el sujeto tiene 10 años de educación formal (A), un puntaje de 60 en prestigio 
ocupacional (Х) y un ingreso de 100 ($ 10000) (Хз), entonces 


Y = 2.9889 + .1296 (10) + .0089 (60) + .0018 (100) = 4.9989 


El error estándar que figura en la tabla (.8604) predice que los puntajes precedidos en 
la escala de tolerancia política se van a desviar de los valores parámetros en .8604 
unidades. 

Los valores B en la tabla son coeficientes de regresión parcial, y pueden ser utilizados 
como medida de la influencia de cada variable independiente sobre la tolerancia política 
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cuando se controlan los efectos de las otras variables. 

Obsérvese en el ejemplo que el coeficiente de correlación múltiple (R) es mayor en 
magnitud que cualquiera de los r, y esto es evidente desde el momento en que es 
imposible explicar menos variación agregando variables. El máximo valor relativo del 
coeficiente total ocurre cuando la correlación entre las variables independientes es igual 
a 0, de manera que, si queremos explicar la mayor cantidad posible de variación en la 
variable dependiente, deberemos buscar variables independientes que, si bien tienen 
correlaciones moderadas con la variable dependiente, son relativamente independientes 
unas de las otras. 

Relacionado con la correlación entre variables independientes, está el problema de la 
multicolinearidad; esto es, cuando las variables independientes están estrechamente 
intercorrelacionadas, tanto las correlaciones parciales como la estimación de los В se 
hacen muy sensitivas a los errores de muestreo y de medición. Cuando la 
multicolinearidad es extrema (intercorrelaciones del rango de .8 a 1.0) el análisis de 
regresión no es recomendable. 

b) La regresión múltiple puede ser utilizada también para evaluar la contribución de 
una variable independiente en particular, cuando la influencia de otras variables 
independientes es controlada. Aquí utilizamos coeficientes de regresiones parciales. Hay 
dos coeficientes designados, la contribución de cada variable a la variación de la variable 
dependiente: coeficiente de correlación semiparcial (part-correlation) y el coeficiente de 
correlación parcial. El primero se denota como гоу.) у el segundo como гуу 1)-2- 

El coeficiente semiparcial es la correlación simple entre el Y original y el residual de 
la variable independiente X! a la cual se le extraen los efectos de la variable 
independiente Ж, es decir que el efecto de X es sacado solamente de la variable ХІ, 
mediante una regresión linear simple de X> sobre Ху, entonces ese residual de Ху es 
correlacionado con la variable dependiente Y. En el caso de la tolerancia política uno 
podría estar interesado en determinar de qué manera el ingreso contribuye a la variación 
de la tolerancia política aparte de lo que es explicado por educación y ocupación. El 
cuadro siguiente permite calcular los valores del coeficiente semiparcial y el coeficiente 
parcial: 


Regresión con dos variables independientes 


A B С 


Ed. (Х,) у Оси. (Х,) Еа. (Х,) е Ing. (X,) Оси. (X,) е Ing. (Xy) 
Regress. ‚5292 .5118 4163 
mult. (R) 


R2 .2800 .2619 .1733 
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Regresión con tres variables independientes 


Ed. (X,) y Оси (X,), e Ing. (Х,) 
Regresión múltiple (R) : .5312 
R2 : .2822 


Coeficiente semiparcial. Su cuadrado es igual a la diferencia entre un R? que incluye 
las tres variables independientes (.2822) y un R? que incluye solamente ocupación y 
educación (.2800). En nuestro caso entonces К? зә) es igual a .0022, indicando que 


ingreso solamente contribuye a un .22% de incremento en la variación de tolerancia 
política por educación y ocupación; en otras palabras, que el incremento es trivial, y que 
se puede ignorar ingreso. Para los casos del coeficiente semiparcial para educación y 
para ocupación los valores respectivos serían .1089 y .0203, es decir que educación 
explicaría aproximadamente un 11% de la variación y ocupación un 2%. 

El coeficiente parcial. Es la correlación entre los dos residuales, el residual de Y y el 
residual de Х] para los cuales y en ambos se han extraído los efectos de Ху. El cuadrado 


de una correlación parcial es el incremento proporcional en la variación explicada debido 
a Ху, expresada como una proporción de la variación que no está explicada por X3. El 


coeficiente de correlación parcial indicaría el grado en que una variable da cuenta del 
remanente de variación del que no dan cuenta las otras variables independientes. En 
nuestro ejemplo de ingreso la correlación parcial es .0031, es decir que solamente da 
cuenta del .31% de la variable dependiente. 

с) El análisis de regresiones múltiples para la determinación de relaciones 
estructurales entre variables. Se trata aquí de una conjunción de la técnica de regresión 
múltiple con la teoría causal. La teoría causal especificaría un ordenamiento de las 
variables que refleja una estructura de eslabones causa-efecto, la regresión múltiple 
determina la magnitud de las influencias directas e indirectas que cada variable tiene 
sobre las otras variables, de acuerdo al orden causal presumido. El método de path 
analysis es un método para descomponer e interpretar relaciones lineares entre conjuntos 
de variables, en los que se parte del supuesto de que el sistema causal es cerrado, 
consistente en causas y efectos encadenados. Las relaciones causales (pathways) se 
representan con flechas que conectan la causa al efecto. 

Cuando se relacionan tres variables de las cuales una es dependiente (efecto), existen 
teóricamente seis maneras a partir de las cuales se puede establecer la relación (ver 
ejemplos en la sección de correlación parcial), con cuatro variables podemos producir 65 
diferentes diagramas, etc. La tarea del investigador es seleccionar entre los diagramas 
posibles aquellos que sean más significativos desde el punto de vista de la teoría 
sustantiva. Cualquier diagrama, por ejemplo, el de la parte superior de la página 
siguiente, puede ser representado e interpretado en términos de ecuaciones estructurales: 
una variable a la que una o más flechas apuntan es interpretada como una función de 
solamente aquellas variables desde donde partan las flechas. 

Uno de los supuestos principales del path analysis es que todas las relaciones son 
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lineares, que las variables son aditivas y que las relaciones son unidireccionales. Cuando 
se cumplen esas condiciones, la función linear toma la forma: 


Xy 


Х, === 


X, 


Xo = Со] 
Donde: 


Хү esla variable independiente, o causa, 
Xo еѕ la variable dependiente, o efecto, 
Сој es una constante que expresa la magnitud del cambio en Хо para cada unidad de 


cambio en Ху. Este coeficiente mide el efecto causal linear, o simplemente el 
coeficiente efecto. 


El path analysis no es una técnica para demostrar causalidad. Es un procedimiento 
para el análisis de las implicaciones de un conjunto de relaciones causales que el 
investigador impone, a partir de algunos supuestos técnicos, en el sistema de relaciones. 

Consideremos ahora un path analysis de tres variables, X3, X,, Ху. Asumiendo que 


existe un orden en la relación entre las variables, digamos, Хз > X > Ху, y suponiendo 
que el sistema sea cerrado, podemos representar la relación de la siguiente manera: 
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о por un sistema de ecuaciones lineares tal como: 
х. = Es 
FE сы y ^ 
Х„=Р,Х,-+ Es 
к ‘7 7 ғ 
X, =P, A+ PA + 2; 


Cada Е; representa todos los efectos residuales en las causas de cada X; y se 
denominan errores independientes o perturbaciones independientes, o variables latentes. 
Cada una de estas variables latentes se estima a partir de cada R? por medio de la 
fórmula 1 = к*,, donde el coeficiente de correlación múltiple R es la parte de la 
ecuación de la regresión en la cual X; es la variable dependiente y todas las variables que 
la causan son usadas como predictores. 

Cada P; indica un path y puede ser estimado a partir de las regresiones de los X; 
sobre los Ху. En el path que aparece más arriba P23 es estimado a partir de la regresión 
de X, sobre X3, donde № = B>343. 

Y donde Руз y Руз pueden ser estimados de las regresiones de X; sobre X> y X3: А = 
B1343 + B174). 

Por lo general, dadas n variables en orden X, <... < А3, < X2, < Х\, la estimación de 
todos los path coeficientes requerirá n — 1 soluciones de regresión, en las que se toma 
cada una de las n — 1 variables de orden menor en el diagrama como independientes en 
sucesión y todas las variables de orden mayor como sus predictores. 

Sigamos el mismo ejemplo de Kim y Kohout (op. cit): tenemos 3 variables: 
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tolerancia (X1), status ocupacional (X2) y educación (Хз); si podemos sostener que el 
grado de tolerancia probablemente va a estar afectado por el nivel educacional y por el 
nivel del status ocupacional, y que el status ocupacional del individuo probablemente va 
a estar influido por su nivel educacional, entonces podemos postular un ordenamiento 
causal débil del про X> > > Ху. Estamos afirmando un juicio de probabilidad en el que 
no sabemos cómo una variable afecta a la otra. Para continuar con el path analysis 
necesitamos otro supuesto, que el sistema causal es cerrado, que es más difícil de 
justificar, pero supongamos que esté justificado. 
Tenemos entonces un diagrama de la siguiente forma: 


E, 


Calculamos los coeficientes de regresión simple para cada uno de los Р„ obteniendo 
los siguientes valores: 


Pamo 
i A E 
Р, = 4 


Calculamos también los valores Е; que resultan ser: 


E, = .866 
E, = .8485 


El diagrama o path analysis tiene ahora la siguiente forma: 
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‚866 


¿Cómo interpretamos este path? a) Primero examinamos cada subsistema, a través de 
las variables latentes. Y vemos que 75% de la variación en ocupación y 72% de la 
variación en tolerancia permanecen sin explicar por las relaciones causales explicitadas 
en el modelo. 

b) Identificarnos los efectos de educación sobre ocupación; de ocupación sobre 
tolerancia, y de educación sobre tolerancia. El coeficiente С; mide los cambios que 


acompañan a X dada una unidad de cambio en X;, estando controladas todas las causas 
extrañas. Los datos son los siguientes: 


Cos =ч Pas 
Cia 
Ci 


c) La covariación total entre pares de variables, representadas por la correlación 
simple, puede ser descompuesta de la siguiente manera: 


ТІ 

IR 

I = 11 
-4 
MA 
Í 
A 
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Ocu., Ed. Tol, Ed, Fol., Ocu. 


(Az. ху (Х,.Х,) (XX o) 

1) Covariación 
Original (ry) 5 5 4 
1) b,: Causal-directa .5 4 2 
b,: Causal indirecta 0 „l 0 

Total causal 
(b,) + (by) = Cy 5 5 2 

П) No causal 

(A) — (В) = Ty — Cy 0 0 0 


——_—_ ана 


Рага la relación entre ocupación y educación, el path analysis confirma los supuestos, 
todas las covariaciones entre los dos son tomadas como causales o genuinas. 

La covariación entre educación y tolerancia es también tomada como causal, pero la 
covariación se descompone entre lo que es mediatizado por ocupación y entre lo que no 
lo es. Aquí parte de la relación entre educación y tolerancia está mediatizada por una 
variable interviniente. 

La relación entre tolerancia y ocupación, esto es, la última columna, está 
descompuesta en componentes causales y componentes espurios. 


Casos especiales en el path analysis 


Hasta ahora consideramos modelos generales de path analysis en los cuales todas las 
relaciones bivariatas eran asumidas como teniendo una relación causal y el sistema como 
un todo era cerrado. Es posible introducir en el path analysis una cantidad de supuestos 
diferentes. Sin embargo, siempre hay que recordar que, cada vez que incorporamos 
supuestos ambiguos, producimos como resultado un modelo que da lugar a 
interpretaciones también ambiguas. Hasta ahora representamos las relaciones bivariatas 
como Х — Y, también podemos representar la relación entre las dos variables de las 
siguientes formas: 
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Х^7—Ү : Esto significa una correlación no analizada, por lo tanto Ја re- 
lación es ambigua, en el sentido en que la covariación puede 
ser causal o espuria, y la dirección de la relación puede ser 
de X a Y o de Y a X. 


X Y : La ausencia de flecha recta o curva significa que no existe 
covariación entre X y Y. 


ХУУ : La curva simple significa que la relación cntre X y Y es com- 
pletamente espuria o no causal, 


XZY ; Representa una relación que es parcialmente causal y parcial- 
mente espuria. 


La relación representada hasta ahora en los diagramas anteriores era del tipo X — Y, 
esto es, asumíamos un orden causal entre las variables. Existen situaciones en las cuales 
no conocemos la verdadera naturaleza de la relación causal entre algunas de nuestras 
variables aunque sí conocemos que existe correlación entre ellas. En este caso, el gráfico 
tendría la siguiente forma: 


7A E, 


Es decir, postulamos relación causal entre Хз y Х] y entre Х y Х], pero las variables 
independientes no están conectadas entre sí por una conexión causal, sino simplemente 
por su correlación. La estimación de Руз y de Ру» se obtiene a partir de las regresiones en 
las que X; es la variable dependiente y X> y X3, variables independientes. Las relaciones 
entre X> y Хз se expresan por un coeficiente de correlación simple. Nótese que el cambio 
total en la variable dependiente no está definido en el modelo, lo que dificulta la 
predicción. 

Cuando existen suficientes elementos en la teoría que efectivamente permiten 
asegurar que la covariación entre las variables exógenas no es de naturaleza causal, el 
modelo puede representarse de la siguiente forma: 
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¿7 
Р,, 


Ahora sí todas las relaciones entre variables pueden interpretarse de manera causal, 
simplemente porque partimos del supuesto menos ambiguo que el del diagrama anterior. 
Aquí, en vez de plantear desconocimiento sobre la naturaleza de la соуапасіоп, 
planteamos que la covariación entre Хз y Х» es de naturaleza no causal, es decir que X3 
no causa variación en Х y viceversa. De esta manera es posible hacer predicciones en 
relación a los cambios que una unidad en X; o en X, producirán en Х]. 


Kim y Kohout presentan otro ejemplo con cuatro variables y un conjunto de 
supuestos fuertes, lo que da lugar a interpretaciones menos ambiguas: se trata de un 
esquema en el que se relaciona sexo (X4) y accidentes de tráfico (Ху), controlando por 
cantidad de kilómetros conducidos al año (X3) y frecuencia de conducción en horas de 
mucho tráfico (X>). 


Los supuestos causales son que el sexo puede afectar tanto la cantidad de kilometraje 
recorrido como las condiciones en las que se maneja, las cuales a su vez van a 
determinar las tasas individuales diferenciales de accidentes de tráfico. El investigador 
no tiene ningún supuesto teórico que le permita relacionar en forma causal el kilometraje 
recorrido con las condiciones de manejo. Asimismo, ni el total de kilometraje recorrido, 
ni las condiciones de manejo se considera que sean totalmente explicadas por sexo, sino 
que a su vez existen una serie de factores que pueden causar ambos. El modelo del path 
adquiere entonces la siguiente forma: 
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х, 


е 


Ez 


Donde las estimaciones de Рзд y de Рд pueden realizarse a partir de coeficientes de 
correlación simple, y los P13, P12 y P14 por las regresiones de X4, sobre X2, X3 y Хд. 

El coeficiente de covariación residual entre X> y Х3 se obtiene a partir de: r33 (Рзд) 
(P24). Los coeficientes para los Е; se obtienen respectivamente de la siguiente forma: 


REGRESIONES CON VARIABLES MUDAS (DUMMY VARIABLES) 


Éste es un caso especial de regresión, en el cual introducimos mediciones a nivel 
nominal en la ecuación de la regresión. Estas variables mudas se obtienen tratando cada 
categoría de la variable nominal como si fuera una variable por separado, asignando 
puntajes arbitrarios según la presencia o ausencia del atributo en cuestión. Por ejemplo, 
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si en afiliación política tenemos 3 partidos políticos: radical, demócrata cristiano у 
conservador, cada uno de esos partidos o categoría representa 1 de 3 variables 
dicotómicas, entonces los puntajes 1 a 0 pueden ser asignados a cada “variable”. Si un 
sujeto tiene afiliación radical, entonces su puntaje en radical será 1, su puntaje en 
demócrata cristiano será 0, y su puntaje en conservador será 0. Los valores 0 y 1 son 
tratados como variables intervalares e incluidas así en la ecuación de la regresión. Sin 
embargo, por un problema de álgebra ? una de las variables mudas debe ser excluida de 
la ecuación de regresión. De hecho, la variable muda excluida actuará ahora como punto 
de referencia a partir del cual se interpretan los valores en cada una de las otras variables 
mudas. Cada categoría ahora es representada por una combinación de las i variables 
mudas. Supongamos en nuestro caso que la categoría de referencia es otro partido; 
tendríamos entonces la siguiente distribución de puntajes: 


Х Х х, 


1 2 
Radical 1 0 0 
Demócrata cristiano 0 1 0 
Conservador 0 0 1 
Otro 0 0 0 


Si ha sido elegido otro como categoría de referencia, la ecuación de la regresión 
puede escribirse entonces como: 


Y=A + B¡X + ВХ + ВАХ» 
donde los casos de la categoría “otros” pueden predecirse mediante: 


Ү= А 


los radicales рог: 
Y=A+ Bi¡X; 
y en la medida en que el valor de radicales X es 1, entonces: 


Ү= А+ В! 
Los valores esperados para cada una de nuestras categorías serán entonces: 
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Radical А + В, 
Demócrata cristiano А + В. 
Conservador A+B, 
Otro A 


Análisis de la varianza unidireccional con variables mudas 


El análisis de la varianza unidireccional puede obtenerse a través de diferentes 
subprogramas en el sPss: los subprogramas anova, oneway y breakdown (ver sección 
análisis de la varianza). En estos tres subprogramas las variables entran como variables 
nominales, no introduciéndose la creación de variables mudas. 

Sin embargo, el investigador puede desear un análisis de la varianza unidireccional 
con el subprograma regression. Para ello debe crear un conjunto de variables mudas 
según el sistema explicado más arriba e instruir al programador para que incluya las 
instrucciones pertinentes para la creación de variables mudas en el sPss. 

El out-put del subprograma regression en su porción referente al análisis de la 
varianza unidireccional tiene la siguiente forma, en la cual introducimos cálculos 
ficticios para las tres variables usadas en nuestro ejemplo con la variable dependiente, 
actitud frente a la nacionalización del petróleo: 


R múltiple .5844 Análisis de var. D. Y Suma сиайт. Е 
К? .3416 Regresión 3 56.3529 16.5993 
Error estándar 1.0638 Residual 96 108.6371 


Variable en la ecuación 


Variable B Beta Error estándar $ F 
D. cristiano 1.3156 4435 ‚4135 10.121 
Кайтса] —.3961 —.1497 ‚3795 1.089 
Conservador —.9444 —.1441 6393 2.183 
(Constante) 2.444 


El valor F de 16.5993 tiene una probabilidad mayor que .001, es decir que las 


diferencias son muy significativas para el conjunto de partidos. El R? es equivalente al 
coeficiente de correlación múltiple que se deriva del coeficiente de correlación eta (ver 
correlación simple), y su valor indica que el 34% de la actitud frente a la nacionalización 
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del petróleo depende o se explica por la afiliación política. 
Los promedios para cada categoría pueden obtenerse a partir de la columna B de 
“variables en la ecuación” que es el out-put de la regresión: 


— Actitud frente a la nacionalización del petróleo: Y = 2.444 
— Radical: Y = 2.444 + 1.3156 = 3.76 

— Р. cristiano: Y = 2.444 + (-.3961) = 2.05 

— Conservador: Y = 2,444 + (-.9444) = 1.50 


Regresiones con variables mudas para dos o más variables categorizadas 


La ecuación de predicción para dos variables nominales (representadas por dos 
conjuntos de variables mudas) es la siguiente: 


Y=A + ВХ] + ВХ + Вз Хз + В.Е 


Donde los X; representan una variable nominal con 4 categorías y Ej una categoría de 


una variable nominal dicotómica. 
El valor predictivo para cada celda de la matriz estará dado por el siguiente cuadro, 
siguiendo nuestros ejemplos anteriores: 


Varón Mujer 


Radical А +В, +В, А + В, 
D. cristiano A+B,+B, А + В, 
Conservador А +В, +В, А + В, 
Otro А + В, А 


Го que ocurre ahora es que las categorías mujer y otro actúan сото categorías de 
referencia. 


Análisis de la varianza multidireccional con variables mudas 


La regresión múltiple con n variables mudas puede ser utilizada para computar análisis 
de la varianza. Cuando se desea computar análisis de la varianza con las variables 
nominales sin recurrir a variables mudas se recomienda el subprograma anova (ver más 
adelante en “análisis de la varianza”). 

Cuando se utilizan variables mudas y queremos realizar análisis de la varianza con el 
subprograma regression es necesario agregar para el caso de dos factores (afiliación 
política y sexo) los efectos de interacción, es decir, necesitamos crear tres nuevas 
variables mudas en nuestro ejemplo: (ХЕ), (ЮЕ), (АЗЕ), donde la ecuación de la 


regresión múltiple tendrá ahora la siguiente forma: 


Y= A + B,X, + В, + B3X3 + B4E¡ + Bs (ХЕ) + Ве (OE) + Ba (ЕЈ) 
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Esta regresión representa el modelo saturado donde todos los términos de interacción 
posible están incluidos. 
Los valores predictivos para el modelo saturado se obtienen del siguiente cuadro: 


Varón Mujer 
Radical A -+ B, +B, +B; A+B, 
D. cristiano A+B, +B, +B: А + В, 
Conservador A+B,+B,+B, А +В, 
Otro А + В, A 


Para dos variables nominales А y B, la estrategia del análisis de la varianza sigue lo 
que se llama modelo clásico de análisis de la varianza en el cual ni los factores A y B 
(afiliación política y sexo) son ortogonales; esto es, si las frecuencias en las celdas son 
proporcionales a las frecuencias marginales de afiliación política y sexo, la suma de 2a y 
de 2b será simplemente la suma de los cuadrados debidos a cada factor y será igual a la 
suma de los cuadrados debidos a efectos aditivos. Si Æ y B no son ortogonales, los 
efectos de A se confundirán con los efectos de B, y la suma de 2(а) y de 2(b) по será 
igual a la suma de los efectos aditivos. El siguiente cuadro ilustra el modelo clásico: 


312 


Suma de 


F сез 
uente de variación сне Df F 
му 1)/K 
1) а de „еза 55 (R4, в, лв) K=k,+k,+%,k, TR KT 
ido a y mo- == 
delo saturado 
2)/ (kl 4k2 
2) Suma de cuadrados 55, (RÂ p) к. +k, A. 
debidos a A y B mo- | (4)/ (N—K—1 
delo aditivo 
" 2 2 (2a)/k1 
A ны жүзө КОО A 
В ajustados рог В 
, ee гр? 2 (2b)/k2 
5 зо аа йын А йел 
В ajustados por 4 
k1k2 
3) Suma de los cuadra- SS, (R? — R? k k (3)/ 
dos debida a la іп- "l кл 4, ») de б —Кк—1) 
teracción 
4) Suma de los cuadra- 55, (1 — Ra, в, АВ) N—K-—1 


dos residuales 


Los significados de este cuadro serán analizados en la sección siguiente que 
corresponde a análisis de la varianza. 


ANÁLISIS DE LA VARIANZA Y DE LA COVARIANZA (SUBPROGRAMAS ANOVA Y ONEWAY) 


El análisis de la varianza es una técnica estadística utilizada para la determinación de 
asociación entre dos o más variables. El análisis de la varianza simple (o unidireccional) 
se refiere a situaciones en las cuales el investigador está interesado en determinar los 
efectos de una variable o factor (medido a nivel nominal) sobre una variable dependiente 
(o variable criterio) que debe estar medida a nivel intervalar. Si el investigador está 
interesado en el efecto simultáneo de varios factores, entonces el análisis de la varianza 
es bivariato o n-maneras. 

En el análisis de la covarianza el investigador está interesado en los efectos tanto de 
variables no métricas como de variables métricas. 


Análisis de la varianza simple 


Habíamos visto en la sección correspondiente a confiabilidad de la diferencia entre 
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estadísticos algunas pruebas para la determinación de diferencias significativas en pares 
de medias muestrales (prueba £ de Student). El análisis de la varianza simple, sobre todo 
en lo referido а la prueba F de Fisher, se emplea de manera similar, aunque ahora sea 
para decidir estadísticamente si la serie de datos entre n pares de medias son lo 
suficientemente diferentes entre sí para permitirnos el rechazo de la hipótesis de que esas 
medias surgieron, por efectos del azar, de una población única. 

La varianza total en muestras combinadas tiene dos componentes: un componente 
representado por la varianza interserial (es decir, por la suma de los desvíos al cuadrado 
de las medias de las submuestras con respecto a la media total), y un componente 
representado por la varianza intraserial (es decir, por la suma de los desvíos al cuadrado 
dentro de cada una de las series de datos). 

Es decir que la varianza total se descompone en dos componentes: una intervarianza y 
una intravarianza: la prueba F es la razón entre la intervarianza y la intravarianza: 


| intervarianza 


intravarianza 


La intervarianza se estima sobre la base de k medias, las que pueden ser consideradas 
como k datos independientes. Puesto que se quiere una estimación de la varianza de la 
población, la suma de los desvíos al cuadrado se divide por los grados de libertad. Es 
decir, en el caso de la intervarianza sería k — 1. La fórmula para el cálculo de la 
intervarianza será entonces: 


En di 


=] 


Intervarianza = 


Donde: 


n =Cantidad de casos en cada una de las series. 
а =Desvío de la media serial con respecto a la media total (Mg — МД). 
k =Cantidad de series. 


La intravarianza se estima sobre la base de las medias muestrales o seriales, de donde: 


2 


f HEF 
Intravariana = ——— 
k (п = 1) 


Donde: 


x =Desviación del puntaje de su media muestral. 


La confrontación de los valores F se hace con tablas especiales, que señalan el nivel 
de significación. Las F mayores o iguales a los distintos niveles indican el grado de 
confianza con el cual se puede rechazar la hipótesis nula. La prueba Е indica solamente 
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si existe о no una diferencia. Para encontrar dónde se encuentra ésta se hace necesaria 
una investigación y tests sucesivos, por ejemplo, pruebas /. 

Un ejemplo de análisis de la varianza simple. Se trata de saber 51 el nivel de ingresos 
difiere por tipo de rama ocupacional. La variable dependiente o criterio será “ingreso” en 
escudos (los datos corresponden a Chile en 1968), por lo tanto, la variable está medida a 
nivel racional. La variable independiente o factor es sector, distinguiendo tres categorías: 
industria, construcción y servicios. 

El siguiente cuadro muestra la distribución: 


CuaDro 1. Distribución de ingreso por tipo de ocupación 


Industria Construcción Servicios 

0- 100 7 1 4 
100- 200 12 + 6 
200- 300 34 12 19 
300- 400 62 30 31 
400- 500 51 24 24 
500- 600 20 12 12 
600- 700 22 15 8 
700- 800 21 8 9 
800- 900 17 8 7 
900- 1000 9 5 5 
1000- 1400 5 5 8 
1400- 1800 8 4 6 


La hipótesis nula a probar es que no existen diferencias entre los distintos promedios 
de ingresos según las tres ramas ocupacionales. 
Los resultados obtenidos son los siguientes: 


— Suma de las desviaciones al cuadrado de los da- 
tos individuales respecto a la — КОГА узганнан 58471950 


— Suma de las desviaciones al cuadrado de los da- 
tos individuales respecto a la media serial ............... 178 652 


-— Suma de las desviaciones al cuadrado de las me- 
dias seriales respecto а la media total ................... 53 293 342 


Estimación de la intervarianza: 100 175 
Estimación de la intravarianza: 89326 
F = 1.12 


La distribución para F con 2 grados de libertad en el numerador y 532 en el 
denominador nos dice que hay una probabilidad de 5% de obtener un valor de F más alto 
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que 3. (3) 


FIGURA 2 
Fl 


Región critica 


Como el valor obtenido para F cae fuera de la región crítica, no podemos rechazar la 
hipótesis nula de que las medias de las poblaciones son iguales. Por lo tanto, se concluye 
que los distintos sectores de la economía considerados no difieren en los niveles de 
ingreso de los trabajadores. 

De haber sido F lo suficientemente grande como para caer en la región crítica, se 
hubiera rechazado la hipótesis nula, correspondiendo un análisis ahora de las diferencias 
entre pares de medias seriales. 

El subprograma breakdown computa análisis de la varianza simple o unidireccional, 
computando medias, desviaciones estándar, intervarianza, intravarianza y valores F. 

Ya vimos más arriba que el subprograma regression computaba también análisis de la 
varianza, aunque son variables mudas. 

El subprograma oneway computa también análisis de la varianza simple; esto es, con 
una sola variable independiente o factor. La ventaja de este subprograma sobre los 
anteriores es que acepta hasta un máximo de 20 variables dependientes; claro que hay 
que especificar una sola variable independiente, y los out-puts son de dos en dos. 


Análisis de la varianza n-dimensional 


En el análisis de la varianza simple las series de datos se diferenciaban en base a un solo 
factor. En un problema de clasificación bidireccional existen dos bases distintas para la 
clasificación; en un análisis tridireccional habrá tres bases distintas para la clasificación, 
etcétera. 

Un problema de análisis bidireccional típico puede ser la comparación de distintos 
métodos para la enseñanza de lectura y escritura en la escuela primaria, combinados con 
distintos tipos de maestros. A este respecto, la comparación de cuatro métodos (global, 
palabra generadora, silábico y “novo”) con 3 clases distintas de maestros (normales 
fiscales, normales privados, especiales) genera 12 combinaciones posibles de método- 
maestro. Si se quisiera incluir una variable o factor adicional, digamos sexo, las 
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combinaciones posibles aumentarían а 24. 

Las fuentes de la varianza en una clasificación bidireccional son ahora: a) Una 
varianza relativa al tipo de método de enseñanza; b) Una varianza relativa al tipo de 
maestro; c) Una varianza de la interacción entre determinado tipo de maestro y 
determinado tipo de método de enseñanza, y d) Una varianza residual o intravarianza, 
que constituye la estimación básica o residual de la varianza una vez que las tres fuentes 
de variación han sido eliminadas. Esta varianza residual puede ser considerada entonces 
como una varianza del error, puesto que representa las influencias de los factores 
desconocidos o no controlados. 

Los grados de libertad en clasificaciones bidireccionales dependen de la fuente u 
origen de la varianza y son: 


Entre líneas r—1 
Entre columnas А – 1 
Interacción (r—1) (k— 1) 
Dentro de las 

submuestras rk (n— 1) 
Total N-]1 


El out-put del subprograma anova provee para un cuadro como el ilustrado los 
siguientes datos de análisis de la varianza: 


- = — -= A ч 


Ejectos principales Suma de cundredos DF F Nivel de sign. 


Métodos ки _ ни A 
Metros = os ЫЕ, AA 

Método-macstro a === — = A 
Residual A Se 25 РЕЦИ ИЧ 
Total =: е == | A 


=- DD o DS 


Para tablas más complejas (digamos, tres variables factor), el programa proveerá los 
cálculos correspondientes a los efectos principales de cada uno de los efectos, 3 efectos 
de interacción bivariata por ejemplo, método-maestro, método-sexo, maestro-sexo; el 
efecto de interacción de los tres factores (método-maestro-sexo), la varianza residual y la 
varianza total. 

Acorde con los valores, el investigador acepta o rechaza sus hipótesis nulas (relativas 
a diferencia entre métodos de enseñanza, tipo de maestros, sexo de los mismos; además 
de las interacciones método-maestro; método-maestro-sexo, etc.). Hay que recordar que, 
para la selección de las combinaciones o de métodos o de maestros especiales, una vez 
que se encuentran valores F significativos, es necesario aplicar pruebas /, con el fin de 
seleccionar aquellos que son más eficaces para el aprendizaje de los niños. 

El cuadro 2 resume las distintas fuentes de variación para problemas n-direccionales. 

En el tipo de ejemplo que describimos (método-maestros), la matriz de datos a partir 
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de la cual se realiza el análisis de la varianza se representa en el cuadro 2. 

El subprograma anova permite cálculos de análisis de la varianza para un máximo de 
5 factores o variables independientes en cada diseño. Como opciones permite análisis de 
la covarianza (hasta 5 covariaciones) y un cuadro de análisis de clasificaciones múltiples. 

El subprograma anova es aplicable tanto para diseños ortogonales (igual número de 
frecuencias en cada una de las celdas) como para diseños no ortogonales (distintos 
números de frecuencias en las celdas). Incluso el programa puede considerar algunas 
celdas vacías. 

El subprograma anova también puede producir un cuadro de análisis de clasificación 
múltiple, por medio del cual los resultados del análisis de la varianza son expuestos de 
manera más específica. Este método es particularmente útil cuando los efectos de 
interacción no son significativos y cuando los factores son variables nominales o 
atributos que no han sido manipulados experimentalmente, y por lo tanto pueden estar 
intercorrelacionados. Para dos o más factores interrelacionados puede ser importante 
conocer el efecto neto de cada variable, cuando se controlan los otros factores. Seguimos 
el ejemplo de Kim y Kohout (op. cit.) para ilustrar la interpretación de un cuadro 
completo de análisis de clasificación múltiple: 

La variable dependiente es el salario semanal de los empleados de una industria. Los 
factores son sexo y raza. En la medida en que se sospecha cierto grado de discriminación 
social, el investigador está interesado en los efectos de los factores raza y sexo. Se sabe 
que dos variables adicionales, nivel de educación y duración en el empleo, determinan el 
nivel de los salarios, así que ambas son introducidas como variables. Los resultados 
obtenidos son los siguientes: 

Clasificación de análisis múltiple: salario por sexo, raza, con educación y duración en 
el empleo. 

Media total: 100 dólares 
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CUADRO E 


Linens ы Columnas (métodos) Suma de Medias de 
(maestros) кынын A = —== Шы das 
] 2 3 4 hasas Nagai 
1 Mas Kan Aag Aaa 
2 " Ы C] " 
A 3 
4 
ЗЫ МІ a Mos Mas Ms 2 М. 
1 As Año Хаз Kaa 
g Li 
В 5 
4 
М М, М, d ha Ma, 
| к Xa Xas La 
2 : 
G $ 
4 е s 
sl Aa Ao Los E Aa £ Мм. 
M Ma, Mo M ey Ma 
Suma de las colum- 
nas (5 хь} E х, E Az E Xi Е Ka E Xi My 
Medias de las em =) а 
lumnas (МГ) М, M, М, м, 


La primera columna del cuadro de la página siguiente expresa las medias еп cada 


categoría como desviaciones de la media total. 


Las medias en la segunda columna expresan las medias de cada categoría (también 


como desviaciones de la media total), pero ahora ajustadas. Las disminuciones en los 
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valores indican que, en el contexto del empleo, sexo y raza están relacionados (cada 
factor disminuye cuando lo ajustamos por el otro factor). Los valores indican que los 
empleados varones tienden a ser blancos, mientras que las empleadas mujeres tienden a 
ser no blancas. 


Desviaciones de la media total 


Variables . Ájustada por inde- 
i Ajustada r ; 
No ajustada del т реп ей pendientes y 
covariables 
Raza 
1-—Blancos +10 6 4 
2—No blancos —40 —24 —16 
(cta y beta) (632) (384) (253) 
Sexo 
1-—Varones 12 8 6 
2—Mujeres —18 —12 —9 
(eta y beta) (.465) (310) (232) 
R Múltiple Е .648 ‚866 
R? 5 .620 .750 


La tercera columna indica que, cuando se introduce educación y duración еп el 
empleo, la influencia del sexo y de la raza disminuye, aunque aún persiste la 
discriminación. 

Los beta y eta que figuran en el cuadro ayudan a su mejor interpretación. Los valores 
de la primera columna son valores eta, mientras que los de la segunda y la tercera son 
beta parciales. Comparándolos vemos que, tanto para el caso de sexo como en raza (en 
este último con mayor intensidad), la relación decrece a medida que se introducen más 
variables de control. 

La correlación múltiple indica la relación entre salario y, como variable dependiente, 
los efectos aditivos de sexo y raza en la segunda columna; y de sexo, raza, educación y 
antigüedad en la última columna. 


ANÁLISIS FACTORIAL (SUBPROGRAMA FACTOR) 


El análisis factorial es una técnica matemática cuyo objetivo más amplio es el 
descubrimiento de las dimensiones de variabilidad común existentes en un campo de 
fenómenos. Cada una de estas dimensiones de variabilidad común recibe el nombre de 
factor. El razonamiento subyacente es el siguiente: si tenemos un conjunto de 
fenómenos, y si cada fenómeno varía independientemente de los demás, entonces habrá 
tantas dimensiones de variación como fenómenos. Por el contrario, si los fenómenos no 
varían independientemente, sino que hay ciertas dependencias entre ellos, entonces 
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encontraremos que las dimensiones de variación serán menores que los fenómenos. El 
análisis factorial, a través de una serie de procedimientos, nos permite detectar la 
existencia de ciertos patrones subyacentes en los datos de manera que éstos puedan ser 
reagrupados en un conjunto menor de factores o componentes. 

Hay cuatro pasos fundamentales en el análisis factorial: 4) Preparación; B) 
Factorización; C) Rotación; D) Interpretación. 

Dentro de cada uno de los pasos existen procedimientos u opciones que se irán 
detallando en la medida en que desarrollemos cada uno de esos pasos. 


A) Preparación 


Consiste tanto en el planteo del problema a tratar cuanto en la formulación de hipótesis y 
recolección de datos. El tipo de variables que el investigador utilice tendrá importancia 
fundamental tanto en lo referente a los factores como a la interpretación. La mayoría de 
las técnicas analíticas requieren variables intervalares al menos, aunque es posible 
utilizar algunas de las medidas de asociación que discutimos en otras secciones de este 
trabajo. Lo importante es que el resultado de este primer paso de preparación es una 
matriz de correlaciones, que adquiere ya sea la forma de un triángulo o de un cuadrado: 


1 2 3 4 5 G 1 сарае É 
1 | fa Pas Ea гы г Гут Гуа нн Туш 
2 fa Ta э Гон Te Mhr Tas ne. Ерш 
W 
a 3 Ta Ты E Тышы ТГ г 2... Куа 
г 
i ж | Га Das Das Es Lgh ro on 
i 
b 5 Тш Ta Tm Ты - Taa 
1 
e б | Ты Te Ta --..** Гар 
| 
g 
Т | Гат Шр rriei Cra 
Я Газ rae Cos 
А TA 
| 


El otro lado del triángulo para completar el cuadrado representa los mismos números 
o correlaciones, ya que la correlación г> es idéntica а ғо], etc. La diagonal designa la 
correlación de la variable consigo misma. 

El investigador tiene una opción en términos de preparación de la matriz de 
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correlaciones: se trata de lo que se da en denominar Q-factor analysis o r-factor analysis. 

Si el análisis factorial se aplica a la matriz de correlaciones de unidades, donde por 
unidad se entiende el objeto, persona, etc., que detenta una característica o conjunto de 
características (es decir, donde correlacionamos pares de unidades), entonces se trata de 
Q-factor analysis. Si las correlaciones se hacen entre variables entre cada раг de 
características o atributos, la técnica se denomina R-factor analysis. 

En términos de preparación de matriz, los usuarios del SPSS en realidad no tienen esta 
opción, ya que el subprograma factor únicamente opera con el análisis de tipo R. Lo 
importante a destacar en esta sección es que el subprograma acepta como input datos 
brutos, matrices de correlaciones o matriz factorial. 


B) Factorización 


La factorización trata de poner de manifiesto por métodos matemáticos cuántos factores 
comunes es preciso admitir para explicar los datos originales o la matriz de 
intercorrelaciones. 

Por este procedimiento surgen “nuevas variables” o factores que pueden ser definidos 
como transformaciones matemáticas exactas de los datos originales (análisis de 
componentes principales), o a través de supuestos inferenciales acerca de la estructura de 
las variables y de su fuente de variación (análisis factorial clásico o de factores 
inferidos). Ya sea que los factores sean definidos o inferidos, los factores iniciales son 
extraídos de tal manera que sean independientes los unos de los otros, esto es, factores 
que sean ortogonales. En este segundo estadio importa más la reducción de la matriz o 
de dimensiones que la localización de dimensiones significativas. 

El análisis de los componentes principales no requiere ningún supuesto acerca de la 
estructura subyacente al conjunto de variables. Simplemente, trata de encontrar la mejor 
combinación linear de variables tal que dará cuenta de una mayor proporción de la 
varianza que cualquier otra combinación linear posible. El primer componente principal 
es entonces el mejor conjunto de relaciones lineares entre los datos; el segundo 
componente es la segunda combinación linear tal que no está correlacionada con el 
primer componente (es decir, es ortogonal al primer componente); el segundo factor da 
cuenta de la varianza residual no explicada por el primer factor; el resto de los 
componentes es definido en forma similar, siendo los componentes tantos hasta cuando 
se haya explicado totalmente la varianza. 

El modelo del componente principal puede ser expresado como: 


z= nF] + a F) + азЕз Ек + Anën 


Donde: 


аң Coeficiente de regresión múltiple estandarizado de la variable j sobre el factor i; 


Е; =Factores definidos. 
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El análisis de factores inferidos está basado en el supuesto de que las correlaciones 
empíricas son el resultado de alguna regularidad subyacente a los datos. Se supone que 
cada variable está influida por varios determinantes, algunos de los cuales son 
compartidos por otras variables (determinante común) y por otros determinantes que no 
son compartidos por ninguna de las otras variables en el modelo (determinante único). 
Se supone entonces que las correlaciones entre variables son el resultado de variables 
compartiendo determinantes comunes. Se espera, por consiguiente, que el número de 
determinantes sea menor que el número de variables. 

El modelo se expresa ahora de la siguiente forma: 


2=451F + ap E) + „ёз + а ЁК d;U; 


Donde: 


U; = Factor único para la variable j; 
d; = Coeficiente de regresión estandarizado de la variable j sobre el factor único j. 


Se asume en el modelo que LA 238 ya y que СЯ 0) е. es decir que el factor único es 
ortogonal a todos los factores comunes y a todos los factores únicos asociados a otras 
variables. 

Si se denota la existencia de una correlación entre cualesquiera dos variables, esta 
correlación es asumida como producto de factores comunes; en otras palabras, que la 
correlación parcial entre las dos variables, controlando por el factor común, dará por 
resultado 0. 

Por la técnica del análisis factorial buscamos especificar un número hipotético 
mínimo de factores tal que todas las correlaciones parciales entre el resto de las variables 
devenga 0. 

La varianza residual —es decir, la varianza que no se explica por los factores 
comunes— y la determinación de las comunalidades es uno de los problemas más 
complejos del análisis factorial. 

Los diferentes métodos para la factorización están basados еп distintos 
procedimientos para la estimación de las comunalidades, y el investigador debe estar 
consciente de las ventajas o desventajas de uno u otro para su diseño de investigación en 
particular. 


Métodos de factorización en el SPSS 


Existen disponibles 5 métodos de factorización:, a) Factorización principal sin 
interacción (PA 1); b) Factorización principal con interacción (PA 2); c) Factorización 
canónica de Rao (RAO); d) Alfa factorización (ALPHA), y e) Imagen factorización 
(IMAGE). 

Los cinco métodos tienen en común las siguientes características: 7) Todos los 
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factores son ortogonales; 2) Los factores son colocados en orden según su importancia; 
3) El primer factor es comúnmente el factor general (es decir, tiene un factor de carga 
significante en cada variable); el testo de los factores tienden a ser bipolares (algunos 
factores de carga son positivos y otros negativos). 


a) Factorización principal sin interacción 


Se compone de dos métodos separados, según el usuario decida por: /) Remplazar la 
diagonal principal de la matriz de correlaciones por estimaciones de comunalidad; o 2) 
La diagonal principal de la matriz no se altera. 

Que la diagonal se remplace o no depende de que el investigador haya extraído sus 
factores iniciales, ya sea por el método de factores definidos o por el método de factores 
inferidos. 

Cuando se utilizan estimaciones de comunalidad, estamos asumiendo la existencia de 
un factor único (©), y al remplazar la diagonal estamos extrayendo los factores únicos 
de cada variable, analizando solamente las porciones remanentes de las mismas. 

Cuando la diagonal de la matriz no se altera, los factores iniciales son definidos, 
consecuentemente los factores principales son calculados según los métodos 
especificados más arriba en la sección de factores definidos. En la matriz de 
componentes principales, los valores de peso asociados a cada componente representan 
la cantidad de varianza total que es explicada por el componente o factor. Esta estadística 
es calculada por el programa. En términos de fórmula uno puede representar entonces la 
varianza total y cada uno de los factores según la siguiente fórmula: 


2 2 2 2 
бт = 04 T 07) + -.. + O 


Donde: 


G 


Ст = Varianza total; 
2 TE Е á 

o; = Varianza explicada por el factor 2. 

A menos que haya indicación del usuario, el programa imprime y retiene únicamente 
componentes cuyo valor de peso sea igual o mayor que 1.0. El número de componentes 
significativos que van a ser retenidos para la rotación final son entonces determinados 
especificando un criterio mínimo de valor de peso. 

b) Factorización principal con interacción 


Es una modificación del primer método, sólo que aquí hay dos procedimientos que se 
hacen automáticamente: a) La diagonal principal es remplazada con estimaciones de 
comunalidad; y b) Las estimaciones de comunalidad son corregidas por un proceso de 
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interacción en el que se van remplazando los elementos еп la diagonal principal de 
manera tal que las diferencias entre dos comunalidades sucesivas sea negligible. Este 
método es el más recomendable para usuarios no familiarizados con los métodos de 
factorización. 


c) Factorización canónica de Rao 


Parte de los mismos supuestos del método clásico de factorización, y centra el problema 
alrededor de la estimación de la varianza única mediante una estimación de parámetros 
poblacionales a partir de datos muestrales. 

Este tipo de factorización aplica un test de significación para el número de factores 
requeridos tal que la cantidad de factores requeridos por los datos y los factores 
hipotetizados no se desvien significativamente del azar. 


d) Alfa-factorización 


Las variables incluidas en el modelo son considerados como una muestra del universo 
de variables. El propósito de esta factorización es definir los factores de manera tal que 
tengan un máximo de generalidad. Su aplicación tiene que ver con inferencia teórica más 
que estadística. 


e) Imagen-factorización 


Es un método bastante complicado desarrollado por Guttman para la determinación de 
comunalidades verdaderas. Por este método se obtiene una aproximación sobre la exacta 
proporción de la parte de la variable explicada por factores comunes y la parte de la 
variable explicada por el factor único. 


C) Rotación 


La rotación es un procedimiento por el cual se trata de encontrar una estructura tal que 
un vector aparezca como una función de un mínimo número de factores. 

Este tercer último paso en la computación de un análisis factorial contiene diversas 
soluciones para la búsqueda de la mejor configuración, soluciones que dependen de los 
intereses teóricos y pragmáticos del investigador. 

Para comenzar, éste debe decidirse por un método de rotación ortogonal o por un 
método de rotación oblicuo. Los métodos ortogonales proporcionan factores terminales 
no correlacionados, mientras que en los métodos oblicuos éstos pueden estar 
correlacionados. En términos gráficos una rotación ortogonal es aquella en la cual los 
ángulos entre los ejes se mantienen a 90°. En las rotaciones oblicuas los ángulos pueden 
ser agudos u obtusos. 

La extracción de factores, tal como fue descrita en la sección de factorización, da 
lugar a una solución inicial que puede o no resultar en una estructura con significado. 
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Por medio de la rotación de los ejes y la solución de ecuaciones lineares simultáneas es 
posible interpretar de forma más adecuada la configuración de los resultados. 

Una representación gráfica en la forma de un espacio de coordenadas cartesianas nos 
ayudará a entender en forma más clara el significado de las rotaciones. Vamos a 
representar solamente dos factores, ya que se trata de ejes cartesianos. Es posible 
representar espacialmente 3 factores (a través de planos), pero es imposible representar 
gráficamente más de tres. 

Е y ЕЁ» están representados por los ejes de referencia. Los factores de carga se 
representaban en el modelo por puntos (si el factor de carga en у de una variable es .20 
y en Р» de .75, se avanza por el eje de las Гу hasta la posición .20 y por el eje de las Р» 


hasta .75; la línea de intersección señalará el punto para esa variable. Y así 
sucesivamente con las otras. 


FIGURA 3 
Factor 2 
no rotado 
F, 
1.0 
Factor 2 rotado 
(Rotación ortogonal) 


# 


/ F В Factor 2 rotado 
F Y (Rotación oblicua) 


F, Factor 1 
-1.0 | , ї А 10 no rotado 


OS ` > Factor 1 rotado 
—0, “\ (Rotación oblicua) 


Factor 1 
rotado 


1.0 


Los valores que figuran en la gráfica corresponden a la siguiente matriz con factores 
de carga no rotados. 
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Fariables F F 


1 г 
А 33 10 
В 15 .63 
С TO „50 
D .85 — 42 
E 60 — 40 
F 69 .57 


La interpretación más elemental es que cuando más cerca están los puntos más 
relacionadas están las variables. Sin embargo, la interpretación a partir de estos dos 
factores es algo ambigua; por ejemplo, vemos que, si bien las variables están “cargadas” 
en el factor 1, el segundo factor es bipolar. Además, si bien la matriz principal provee 
información sobre factores de carga y comunalidades, no nos da una información precisa 
sobre la estructura de las relaciones. De por sí la matriz original (no rotada) es arbitraria, 
en el sentido de que se pueden trazar infinito número de posiciones. La rotación de los 
ejes es entonces un medio para buscar la mejor manera de acomodar los datos en un 
espacio n-dimensional. 

Una razón adicional para la rotación, como señala Kim (ор. cit.), es que los factores 
de carga en la solución no rotada dependen muy estrechamente en el número de 
variables. Los factores rotados son más estables. En fin, el objetivo de la rotación es la 
obtención de factores teóricamente significativos. 

Las líneas de puntos en la gráfica señalan una rotación ortogonal para los datos que 
aparecen en el cuadro anterior. Las líneas segmentales señalan una rotación oblicua. 

Por lo general, los cuadros rotados proporcionan patrones mucho más claros. 
Siguiendo el ejemplo hipotético presentado, los factores rotados y no rotados serían 
ahora (rotación ortogonal): 


— шшш Á Ii TA A 


Factores no Fuctores 
Any rotedos ratados 
Катта бея 
Fi F, F, F, 
A 8% „10 60 “В 
E 7% 63 .14 95 
G 70% -kl 29 К.т. 
D та =.*7 -94 „Пр 
Е 60 — 40 ‚Та AE 
F Күн] de ¿14 © 


=== ш: а 


La estructura de los datos es ahora mucho más clara, aunque la variable A sigue 
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teniendo carga en los dos factores. Por lo demás queda claro que еп el factor 1 
intervienen las variables D y E, mientras que en el factor 2 la carga se concentra en las 
variables D, Су F. 

Las rotaciones, cualquiera que sea su tipo, tienen como objeto hacer que los valores 
en la horizontal o en la vertical de los ejes se aproximen lo máximo posible a 0. Al hacer 
esto con un factor, maximizamos a la vez el valor del otro factor. 

Los métodos de rotación incluidos en el SPSS son: ¿) Rotación ortogonal quartimax; її) 
Rotación ortogonal varimax; iii) Rotación ortogonal equimax; iv) Rotación oblicua. 

1) Rotación ortogonal quartimax. Esta rotación sigue el principio de reducción del 
máximo de complejidad en una variable, mediante la rotación de los factores iniciales, 
de tal manera que el factor de carga se concentre en un factor, haciendo que el peso de 
los otros factores se acerque lo máximo al valor 0. Este método destaca la simplificación 
de las líneas, por lo tanto, el primer factor rotado tiende a ser un factor general (muchas 
variables tienden a concentrar su peso en él). Los siguientes factores tienden a ser 
subconglomerados de variables. 

11) Rotación ortogonal varimax. El método varimax se concentra en la simplificación 
de las columnas de la matriz inicial. Es el método de uso más generalizado. 

111) Rotación ortogonal equimax. Es un método intermedio a los dos anteriores. En 
vez de concentrarse en la simplificación de las líneas (quartimax), o en la simplificación 
de las columnas (varimax), equimax trata de lograr algo de cada una de esas 
simplificaciones. 

iv) Rotación oblicua. En las rotaciones oblicuas se acepta por principio que los 
factores están intercorrelacionados. A partir de esto, los ejes son rotados libremente de 
manera tal que los hiperplanos se coloquen oblicuos los unos a los otros. Hay diversos 
métodos de rotación oblicua (a partir de los gráficos de las rotaciones ortogonales, el 
método del plano único de Thurstone, de rotación directa hacia estructuras primarias de 
Harris, etc.). El método utilizado en el subprograma es un método de rotación oblicua 
objetivo, utiliza un método directo para la simplificación de los factores primarios de 
carga. Los factores son intercorrelacionados, si tales intercorrelaciones existen; sin 
embargo, algunos métodos tienden a hacer que los factores resultantes estén más 
correlacionados que otros métodos. En el método rotacional oblicuo, los valores б son 
colocados en 0 (son los que por lo general tienden a reproducir las mejores soluciones 
oblicuas). Sin embargo, el usuario puede alterar los valores б para lograr menor o mayor 
oblicuidad. Cuando varios valores ё son especificados, el programa calculará una 
rotación oblicua para cada valor especificado. 


D) Interpretación 


Es la tarea teórica de identificar el contenido y la naturaleza de los factores. Esto se hace 
mediante procesos inferenciales acerca de qué tienen en común las variables con alta 
carga con las variables de carga moderada, o con las variables con factores de carga 
próximos a cero. Esas inferencias son probadas a posteriori en otros diseños con las 
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hipótesis necesarias, etcétera. 


Producto del programa factor 


Un cuadro de análisis factorial completo provee la siguiente información: 

1) Una matriz de correlaciones de las variables en el modelo tal como aparece en la 
figura. 

2) Factores de carga iniciales. Este cuadro contiene factores ortogonales 
proporcionando el patrón y la estructura de la matriz. Ya sea que los factores sean 
inferidos o definidos, se ordenan por importancia decreciente. 

Cuando existe un solo factor se dice que el conjunto de variables es puro, o saturado, 
o cargado con el factor; cuando hay más de un factor, se dice que el conjunto es 
factorialmente complejo. Este cuadro nos informa tanto sobre el número de factores 
como de la magnitud de la carga o saturación de cada variable en cada uno de los 
factores iniciales. Los factores de carga varían de —1.0, pasando por 0, hasta +1.0 y se 
interpretan de la misma manera que un coeficiente de correlación (de hecho los factores 
de carga expresan la correlación entre las distintas variables y los factores). Las 
comunalidades son la suma de los cuadrados de los factores de carga en una variable y 
expresan el factor de varianza común: h” = (Fi) + (Е) + ... (2). Con base en la matriz 
inicial, el investigador puede decidir sobre la cantidad final de factores a retener. 

3) Pesos para estimar variables a partir de factores (factor-pattern matrix). Contiene 
los pesos de regresiones de los factores comunes y nos informa sobre la composición de 
una variable en términos de factores hipotéticos. Esta matriz es rotada y nos permite 
expresar la variable como una combinación de variables independientes, sean éstas 
definidas o inferidas. 

4) Pesos para estimar factores a partir de variables (factor-estimate o factor-score 
matrix). Provee medios para estimar puntajes en los factores a partir de las variables 
observadas. 

5) Correlación entre factores y variables (factor-structure matrix). Proporciona el 
coeficiente de correlación entre cada variable y cada factor. La solución es rotada, siendo 
este cuadro idéntico a la factor-pattern matrix. 

6) Matriz de correlación para los factores terminales. La interpretación de los 
cuadros es diferente, según la solución haya sido ortogonal u oblicua. Las matrices 
básicas para los dos tipos de soluciones son: 
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O ——- ——_——_——_——————— A 


Solución ortogonal Solución oblicua 


Dates básicos Matriz de correlación idéntica 
Factores iniciales lléntica matriz factorial ortogonal 
Factores terminales Factor-matrix a) Patbermomatrix 


b) Siructure-mabrix 
Correlación entre factores Factor-correlation matrix 


Factoresbimale matrix Factor estimole matrix Factorestimale matrix 


E 


Soluciones terminales para factores rotados ortogonalmente 


Los coeficientes en el cuadro representan tanto pesos de regresión (pattern-matrix) como 
coeficientes de correlación (structure-matrix). Esto es porque la solución es ortogonal. 
El ejemplo de Kim nos ayudará a interpretar el cuadro: 


Matriz faciorial [inal con rotación varimax 


Parador Factor l Farior 2 Facior 3 
A „58920 07829 05230 
В -78525 14025 05768 
С, 10210 7352 06342 
[) 07297 A5652 10643 
Е 03390 09470 -TEAN 
F 12345 00320 60532 


G 32460 34210 01271 


A 


Examinando rada variable (es decir, cada línea), vemos que el determinante más 
importante en la variable 4 es el factor 1, lo mismo que en la variable B. Para las 
variables Су Р el determinante más importante es el factor 2. Para las variables E y F el 
factor más importante es el 3. Todas estas variables tienen por consiguiente una 
complejidad de 1. La variable G, por el contrario, tiene como determinantes principales 
los factores 1 y 2, por lo tanto su complejidad factorial es de 2, es decir que ésta no es 
una variable que se explique por una dimensión, sino que mide dos dimensiones; y así 
sucesivamente para complejidades factoriales 3, 4 ... n. 

Leyendo ahora las columnas, podemos determinar cómo los factores hipotéticos (cada 
uno de los factores que aparecen en el cuadro y que representan las variables 
independientes que explican cada una de las variables en el cuadro) dan cuenta de cierta 
proporción de la varianza en la variable dependiente. 

Por ejemplo, la varianza de la variable А explicada рог el factor 1 es (.8892)? = 
.79067, es decir, 79% de la varianza de А es explicada por el factor 1. 
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Siguiendo el mismo razonamiento, la proporción de la varianza explicada por todos 
los factores, en el caso de la variable 4, es: 


h? 4 = (88920)? + (07829) + (.03230y? = .79783 


Esto es lo que llamamos más arriba comunalidad, y es claro que en el caso de la 
variable А la contribución de los factores 2 y 3 es mínima (exactamente .00716). 

El complemento de la comunidad (1 — h’ ) representa la proporción de la varianza 
única, es decir, la proporción de la varianza no explicada por los factores comunes, o por 
ninguna variable en el conjunto. 

Con los datos de la matriz, el investigador también puede calcular los coeficientes de 
correlación entre cualquier par de líneas, determinando así las fuentes de variación 
común a ambas variables. Por ejemplo, la correlación entre la variable Æ y la variable B 
en los tres factores es: 


Fia == Tif ar + Түр эр, + Pira ЫРА == (88920) (78523) -f= (.07829) 
(.14023) + (.03230) (.05768) = .71105 


La correlación entre 4 у В es debida básicamente al factor 1. Mediante la fórmula se 
pueden calcular las intercorrelaciones para todos los pares de variables. 


Soluciones terminales para factores rotados oblicuamente 


En una solución oblicua habrá dos matrices separadas, una para la pattern-matrix y otra 
para la structure-matrix. La pattern-matrix delinea más claramente la agrupación de 
variables. El cuadrado de un pattern-coeficiente representa la contribución directa de un 
factor determinado a la varianza de una variable. En la medida en que un factor puede 
contribuir a la varianza de una variable a través de otros factores correlacionados (es 
decir, una contribución indirecta), el total de la varianza del que da cuenta un factor no 
es igual a la suma de las contribuciones directas. 

La matriz de estructuras (structure-matrix) consiste en coeficientes de correlación. La 
contribución entre la variable 4 y el factor 1 en el ejemplo que sigue es .97652 y su 
elevación al cuadrado dará cuenta de la cantidad de varianza en la variable А explicada 
por el factor 1. 
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Matrices фата factores oblicuos 


————_—_——__—— 


Pabterms=motriz ТЕЧ 
Farabiles II аы аы аы алыныа ын = 

Factor 1 Factor 2 Factor ] Factor 2 
А 0078 =, 1 1012 07652 03240 
E ATL — DALE B7234 ШЧ? 
C 6098 24920 22600 ABODO 
D —.082002 9870 -11721 ФЕ 
Е 


05368 26725 24231 07323 


El subprograma factor provee una representación gráfica de los tres métodos de 
rotaciones ortogonales. Ya que la representación se hace en ejes cartesianos, los factores 
son tomados de dos en dos, es decir, si hay tres factores habrá tres gráficos (ү con Р; 
Е con Езу F> con F3). Por este gráfico, сото ya señalamos más arriba, el usuario tiene 
una idea más clara sobre el agrupamiento de variables, sus valores, etc. Pudiendo 
utilizarlos para decisiones sobre la rotación oblicua por ejemplo. 

El programa factor también construye índices compuestos que representan las 
dimensiones teoréticas asociadas a los respectivos factores. 


ANÁLISIS DISCRIMINANTE (SUBPROGRAM DISCRIMINANT) 


Es una técnica estadística para la clasificación, predicción y análisis en problemas de 
grupos o clases de objetos. Puede ser utilizado tanto para la determinación de las 
diferencias entre dos o más grupos como para —a partir de esas diferencias— construir 
esquemas clasificatorios de manera que sea posible clasificar cualquier caso cuya 
pertenencia a un grupo específico nos es desconocida. 

Los supuestos que subyacen en el análisis discriminante son: a) Los grupos son 
discretos e identificables; b) Cada observación en los grupos puede ser descrita por un 
conjunto de mediciones de m características o variables; c) Las m variables tienen una 
distribución normal multivariata en cada población. 

La distinción entre los grupos se realiza a partir de un conjunto de variables 
discriminatorias, esto es, variables que el investigador sospecha que miden 
características sobre las cuales los m grupos difieren. Por medio del análisis 
discriminante esas variables son combinadas linearmente de manera que se maximice la 
distinción entre los grupos. 

Las combinaciones entre las funciones discriminatorias toman la forma de una 
ecuación donde las funciones discriminantes son: 


D; = ал21 + 4222 вая dimZm 
Donde: 
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D; = Puntaje de la función discriminante i. 
4; = Coeficiente de carga. 
2; = Valor estándar de las m variables discriminantes utilizadas. 


Una vez que se determinan las funciones discriminantes, éstas pueden ser utilizadas 
para propósitos de clasificación y de análisis. 

Como técnica clasificatoria, el análisis discriminante puede ser utilizado para 
clasificar cualquier caso cuya pertenencia a un grupo específico nos es desconocida. Es 
decir, se construyen un conjunto de reglas para clasificar las observaciones en el grupo 
más apropiado. Por ejemplo, una vez determinadas las características que diferencian a 
conservadores de radicales, podemos utilizar las combinaciones lineares de las variables 
discriminatorias en la determinación de la probabilidad de que un miembro cualquiera 
cuya afiliación desconocemos se adhiera a conservadores o radicales. 

Como técnica analítica el análisis discriminante permite detectar en qué medida las 
variables discriminatorias efectivamente discriminan cuando se combinan en funciones 
discriminantes. También es posible reducir el número de funciones discriminantes, 
siguiendo el mismo tipo de razonamiento utilizado en el análisis factorial. Por medio de 
la técnica es posible el estudio de las relaciones espaciales entre los grupos, así como 
identificar las variables que contribuyen de manera más significativa a la diferenciación 
entre los m grupos. 

Los pasos en el análisis discriminante son los siguientes: 

1) El investigador selecciona un conjunto de variables que sospecha que van a 
diferenciar entre los m grupos. Las variables pueden ser tantas como el investigador 
considere necesarias. 

2) Las variables seleccionadas en el primer paso pueden a su vez ser seleccionadas o 
no para su inclusión en el análisis discriminante. Si el investigador decide incluir todas 
sus variables, se deben dar instrucciones (rutina Method = direct) por medio de las 
cuales las funciones discriminantes se crearán independientemente del poder 
discriminatorio de cada una de las variables independientes. 

Si, por el contrario, el investigador decide seleccionar sus variables en base al poder 
discriminatorio, es decir, si decide introducir un criterio estadístico adicional a los 
teóricos, existen 5 criterios de selección disponibles en el sPss. Los procedimientos de 
selección operan de manera que seleccionan primero la variable que tiene el valor más 
alto en el criterio de selección; luego esa variable es apareada con cada una de las otras 
variables hasta seleccionar una segunda variable que, combinada con la primera, mejora 
el criterio de selección; luego se aparean estas dos variables con cada una de las que 
quedan hasta seleccionar una tercera variable que combinada con las dos anteriores 
mejora aún más el criterio; y así sucesivamente, hasta que la inclusión de una variable 
adicional no provea un mejoramiento en la discriminación entre los grupos. 

Estos métodos de ubicación de las variables por rango y de evaluación de su poder 
discriminatorio no tienen la precisión de los análisis de regresión, ya que no existe una 
prueba clara para determinar la significancia de un coeficiente en particular en una 
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función discriminativa dada. De ahí que los 5 métodos que se mencionan subrayan 
distintos aspectos de la separación. 

Método de Wilks (Method = Wilks). Está basado en una prueba de significación de las 
diferencias entre grupos, mediante el test F de las diferencias entre grupos centroides. El 
método toma en consideración la diferencia entre todos los centroides y la cohesión entre 
los grupos. Las variables pueden ser ordenadas según los valores de los coeficientes 
lambdas de Wilks de manera que se dé un rangueamiento en referencia a su poder 
discriminatorio relativo. A más bajo valor de lambda, más alto poder discriminatorio de 
la variable. El inconveniente de este método es que deja de considerar las correlaciones 
entre el conjunto de variables que se está utilizando, de manera que solamente en los 
casos en que las variables sean independientes (no correlacionadas) este método 
permitirá un ordenamiento y comparación válidos. 

El método Mahal (Method = Mahal) maximiza las distancias mahalonobis entre los 
dos grupos más próximos. 

El método Miniresid (Method = Miniresid) separa los grupos de manera que la 
variación residual sea mínima. Tomando en cuenta la correlación múltiple entre el 
conjunto de variables discriminantes y una variable muda que identifica el par de grupos 
correspondiente, su objetivo es minimizar R, esto es, la variación residual. 

El método Maxminf (Method = Maxminf) maximiza la distancia entre los grupos de 
manera que se seleccione la razón R más pequeña entre dos pares de grupos más 
próximos. 

El método de Rao (Method = Rao) utiliza una medida de distancia V. La variable 
seleccionada es aquella que contribuye al aumento más grande en V cuando se agrega a 
las otras variables, de manera que se obtenga una separación máxima entre los grupos. 
Estas decisiones tienen que ver con la comparación del poder discriminatorio en 
diferentes conjuntos de variables (diferentes en relación a su tamaño). La solución de 
Rao tiene que ver con la significancia que puede tener la agregación o no de una variable 
en particular. 

3) Determinación del número de funciones discriminantes. Para cualquier cantidad de 
grupos o cualquier cantidad de variables discriminantes, el máximo número a derivar 
será igual a la cantidad de variables discriminantes o a la cantidad de grupos menos 1, 
cualquiera que sea menor. Es decir que tres funciones pueden ser suficientes para 
describir a dos grupos. El subprograma discriminant provee dos medidas para juzgar la 
importancia de las funciones discriminantes: porcentaje relativo del eigenvalue asociado 
a la función y la significación estadística de la información discriminatoria. 

El eigenvalue es una medida especial que representa los valores característicos de una 
matriz cuadrada, y es una medida relativa de la importancia de la función, en la medida 
en que la suma de los eigenvalues es una medida de la variancia total que existe entre las 
funciones discriminantes; así un eigenvalue en particular es expresado como un 
porcentaje de esa suma. En la medida en que las funciones discriminantes son derivadas 
por orden de importancia, el proceso de derivación es para cuando el porcentaje relativo 
(es decir, el valor del eigenvalue) es demasiado pequeño. 
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El segundo criterio para juzgar la importancia de las funciones discriminantes es el 
test de la significación estadística de la información discriminante todavía no 
contemplada por las funciones ya determinadas. El método de cálculo utilizado es el 
lambda de Wilks. 

4) Interpretación de los coeficientes de función discriminante. Habíamos visto más 
arriba que la ecuación de las funciones discriminantes era: 


D¡=d1L1 + 4р8) +... + dimZm 


Los coeficientes de la función discriminante corresponden a los а; y son utilizados para 


computar el puntaje discriminante que es el resultado de aplicar la fórmula que aparece 
más arriba. Habrá por lo tanto un puntaje separado para cada caso en cada función. En la 
medida en que los puntajes Z son estándar, su media es 0 y su valor estándar es 1. Por lo 
tanto, cualquier puntaje singular representa una desviación de la media de todos los 
casos sobre una función discriminante dada. 

Computando el promedio de los puntajes para un grupo en particular, tenemos 
calculada la media del grupo en la función discriminante respectiva. Para cada grupo, las 
medias de todas las funciones se denominan grupo centroide; éste señala la localización 
más típica de los casos en ese grupo con referencia al espacio de la función 
discriminante. Una comparación de las medias de los distintos grupos en cada función 
nos indica entonces cómo se distribuyen los grupos a lo largo de una dimensión. 

Los coeficientes estandarizados de las funciones discriminantes se pueden interpretar 
en forma similar a los coeficientes beta en las regresiones múltiples. El signo del 
coeficiente nos indica $1 la contribución de la variable es positiva o negativa. El valor del 
coeficiente indica la contribución relativa de la variable a la función. Los coeficientes 
estandarizados pueden ser utilizados —como en el análisis factorial— para identificar 
las características dominantes que ellos miden, nombrándolos así según características 
teóricas. 

El programa contiene una opción para el cálculo de coeficientes no estandarizados, 
útiles para propósitos computacionales, pero que no nos informan sobre la importancia 
relativa de las variables. 

3) Distribución gráfica (plots) de los puntajes discriminantes. El programa imprime 
una representación espacial de la distribución de los puntajes discriminantes a lo largo 
del continuo de dos primeras funciones discriminantes. Es posible obtener ya sea la 
distribución de todos los casos en un gráfico, o gráficos separados para cada grupo. La 
representación espacial es particularmente útil para el estudio de los grupos centroides y 
su localización relativa, así como también para un análisis del grado en que los grupos se 
superimponen. Cuando solamente existe una función discriminante, la distribución toma 
la forma de un histograma. 

6) Rotación de los ejes de las funciones discriminantes. Tal como en el análisis 
factorial, es posible rotar la orientación espacial de los ejes manteniendo constante la 
localización relativa de los casos y de los centroides. Un criterio puede ser la solución 
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varimax, esto es, hacer rotar los ejes de manera que las variables discriminantes se 
aproximen a 1.0 o a 0.0. Mediante esto, si bien es posible mejorar la interpretación de la 
distribución de las variables principales, hay pérdida de información referente a la 
importancia relativa de cada función. 

7) Clasificación de casos. Por este proceso es posible identificar la pertenencia de un 
caso a un grupo determinado, cuando solamente conocemos los valores del caso en las 
variables discriminatorias. La clasificación se logra mediante el uso de una serie de 
funciones de clasificación, una para cada grupo. Se computan para cada caso tantos 
puntajes como grupos existen y el caso es clasificado en el grupo con el puntaje más 
alto. Los puntajes pueden ser asimismo en probabilidades de pertenencia a grupo 
asignándose el caso al grupo cuya probabilidad de pertenencia es más alto. 

El sistema de clasificaciones de probabilidad es útil no solamente para adjudicar 
casos en un grupo, sino además para controlar cuán efectivas son las variables 
discriminantes. De ahí que sus valores se utilicen aun para los casos de selección de 
variables y de funciones. Si existe un número de casos cuya afiliación conocemos, pero 
que están mal clasificados, entonces las variables seleccionadas son muy pobres en el 
proceso de discriminación. 


Algunos ejemplos de análisis discriminante 


a) Ejemplo en dos grupos 


El ejemplo es de una aplicación de Heyck y Klecka, y aparece en el Manual del 5Р5. Se 
trata de un análisis del Parlamento Británico durante el periodo 1874-1895, en el que el 
Partido Liberal estaba fraccionado entre radicales y no radicales. Algunos miembros del 
Parlamento fueron clasificados en uno u otro grupo según documentos históricos. Sin 
embargo, quedaron sin clasificar un conjunto de miembros para los cuales no se disponía 
de suficiente información o para los cuales la información era contradictoria. 

Las variables discriminantes seleccionadas fueron votos en el Parlamento, los votos 
en asuntos particularmente relacionados al programa radical. Se seleccionaron 17 de 
estas variables, siendo los asuntos a votar los siguientes: 
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Fecha 


25/marzo [74 1. Horas de votación 

17 fabril 74 2. Gastos de la Corona 

10/junio 74 3. Educación no sectaria 

17 /junio [74 4. Temperance reform 

9jjunio (75 5. Escolarización obligatoria 
17/junio [75 6. Parlamentos trienales 

14/junio [75 7. Asignaciones de tierras 

15/julio /75 B. Gastos de la Corona 

15/julio /75 9. Extensión 

5/abril [76 10. Educación gratuita 

30/mayo {76 11. Extensión 

10/julio ¿76 12. Control del estado en educación 
13/marzo [77 13. Temperance reform 

23/marzo [77 14. Reformas en Turquia 

13/mayo /80 15. Prerrogativas de la Corona en política externa 
24/febrero/80 16. Parlamentos quinquenales 
5/marzo /80 17. Temperance reform 


Los votos desde el punto de vista radical fueron clasificados con +1, los votos en contra 
con —1 y las abstenciones con 0. 

Antes de calcular el análisis discriminante las variables fueron seleccionadas para su 
inclusión mediante el método V de Rao, así solamente se seleccionaron 11 de las 17 
ocasiones de voto. Esos 11 votos proveían un alto grado de separación entre los grupos 
(el lambda de Wilks dio como valor .19264 con una correlación canónica de .899 para la 
función discriminante). Las variables eliminadas fueron la 6, 7, 8, 9, 10 y 17. 

Los valores obtenidos después del análisis discriminante para las 11 variables 
discriminatorias fueron los siguientes: 
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F фата incluir мыл, Lambda Rao Cambio 


Рио тас? 
múmera Varinble Ё рны. incluido de Wilks F de ган 
1 Мағ 5 59.95802 1 0.66125 39.97799 30.05790 
2 Var011 33.86707 z 0.45926 91.83968 51.868168 
3 “агй14 14.95441 % 0.389570 12528114 5544147 
4 Vard05 10.58081 4 0.99584 154.25507 25.97392 
5 Var0l15 8.9088 1 5 0.29943 192.40681 28.24174 
b Маго 8.05268 6 0.26770 213.37398 30.87717 
7 Varje 6.10148 7 0.24678 232.065%0) 24.09182 
Б Vard0l 5.55072 8 0.22889 262.77515 24.70955 
9 Vardl6 6.10082 g 0.21054 292.47461 29.60046 
iù Var0l2 3.38319 10 0.20070 310.63940 13.10479 
11 “аг М. 2.4360 11 0.19264 526.30048 16.25098 
Clasificación de coeficientes de función 
Grupo Grupo no Cocficientes 
radical radical discriminantes 

Varó0l 4.78972 1.72740 0.140 

Маг002 9.77127 0.07671 —0.410 

Маг 3.41047 1.11915 — 0.0151 

Vartti 0.40825 —1.01541 (0.158 

Vard05 5.9692 1 2.52984 —0.382 

Жаг1 1 5.91122 1.46605 —0.275 

Var0l2 361321 0.07682 —0.293 

Var013 9.12955 0.53550 —0.788 

Жагй14 1.31335 —0.79479 —0.2H 

Var0l5 1.21790 — 0.862530 —01231 

Varbl6 2.82 108 —0,42259 —0.360 

Constant —12,65345 —1.02266 1.167 

Funciones Foroen- Correla- Fungi Lambda Ji 

diser asla taje Te ción cd» nes de- МЕР ЮЕ 


minentes Lativo nónica rivndas Wilks 


1 4.19092 100.00 0.899 0 0.1926 119.401 11 
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Coeficientes estandarizados de función discriminante 


Vartti = 0.1 7M1 
Varti —0.20581 
Матіз. б.а 
Мачин Ad, 10021 
Vardis =. 783 
Varbl1 —0.13131 
Var012 —0,15519 
Магі —0,20511 
Vardi4 ==. КҮЗ 
Vardl5 0.10550 
Vardl6 —0,17411 


Centroides de grupo en espacio reducido 


Grupo 1 —(В%1%4 
Grupo 2 091895 


FiGura 4. Distribución gráfica (plots) de los puntajes discriminantes 
фата miembros del Parlamento Inglés; 1874-1895 


| A 
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| 
| | 
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| xXx ХХ ML ENE X 
| AIEN хах ХХКХХХКХХ WENXNNNNE N | ï 
| Media по Стиро по 

radical radical 
| © | 

| х х xx 

х хх XXX Xxx 

l х| х х HAWAN EMMAKMM ХХХ XNE NE ï 
| Grupo incierto 
4 x 
| х Ж 
f x EN 
| XOXE I к XEN я 
| К ХАК Ж х N NEEN MIX ï 

Ж XxX E х E XE хх} ENNHAN WEEN WKE К к Xx ® 

jx KENE X NIN AKANE | RAUL ROL KRAN Х XN i 

=s | A ык иша. кын a o аа аа A == A „Кы „эы. 
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Los coeficientes discriminantes no estandarizados son utilizados para calcular el 
puntaje discriminante para la función. Esto se obtiene multiplicando cada coeficiente por 
el valor en la variable (voto) y luego sumando los productos más la constante. 
Supongamos los votos de dos miembros del parlamento, sir Wilfrid Lawson y lord 
Hartington. 

En la votación de los diferentes asuntos los miembros lo hicieron de la siguiente 
forma (+1 indica voto radical, —1 en contra y 0 abstención). 


Foeriable Lanjon Harlington 


І 1 0 
£ 0 0 
3 +1 +1 
4 +1 0 
5 +1 0 
11 +1 +] 
12 +! 0 
13 +1 =] 
14 +1 0 
15 1 = | 
16 41 Ü 


Los puntajes para los dos miembros serán entonces: 
Lawson 


D = (—.340) (+1) + (—410) (0) + (-254) (+1) + (—.158) (+1) + 
(—.382) (+1) + (—.275) (+1) + (—.293) (+1) + (-.288) (+1) + 
(—.234) (+1) + (-281) (+1) + (—.360) (+1) + (1.167) = —1.648 


Hartington 


D = (—.340) (0) + (410) (0) + (-254) (+1) + (—.158) (0) + 
(—.382) (0) + (—.275) (+1) + (—.293) (0) + (—.288) (—1) + 
(—.234) (0) + (—.231) (—1) + (-.360) (1) = 1.157 


Los puntajes calculados para todos los miembros aparecen en la distribución gráfica. 
Donde 0 es la media total de todos los radicales y no-radicales conocidos. 

El siguiente paso es la clasificación de los miembros no identificados claramente 
como radicales o no-radicales. Esto se hace calculando para cada uno de ellos el puntaje 
discriminante, usando los coeficientes derivados de los radicales y no-radicales 
conocidos. La lógica de la clasificación se basa en la comparación de las pautas de votos 
de radicales conocidos con las pautas de votos del miembro incierto, de manera de 
clasificarlo en el grupo más similar en cuanto a pauta. Para ello se utilizan una serie de 
ecuaciones (una para cada grupo), cada ecuación dará lugar a una probabilidad, y el 
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miembro será colocado en el grupo рага el cual obtiene una probabilidad más grande. 
Este sistema tiene algunos problemas, sobre todo cuando las probabilidades de 
pertenencia a uno u otro grupo son del tipo .53, .47. Sucede en el caso del ejemplo que 
consideramos que algunos miembros no muestran una pauta consistente de apoyo a uno 
и otro grupo. 


b) Ejemplo con varios grupos 


El ejemplo es de Gansner, Seegrist y Walton беп el que se trata de seleccionar 
subregiones en el Estado de Pennsylvania (Estados Unidos) mediante una combinación 
de análisis discriminante y técnicas de agrupamiento (Clustering techniques). La 
regionalización está relacionada con un análisis de la eficiencia económica de la 
industria de la madera, con el objetivo de desarrollar un sistema más eficiente de tala y 
entrega de derivados de la madera. Se busca que las subregiones sean homogéneas y 
compactas en términos de producción de madera y de mercado potencial. Se busca 
además que cada subregión tenga fronteras equidistantes de sus centros de consumo. 
Las variables discriminantes seleccionadas fueron las siguientes: 


ағыт ег que reflejen exblencia 


Foriables que reflejan ectiudad 


de medera y accesibilidad de mercado y demanda 
1: Bosques comercializables como 9, 9: Promedio anual de producción de 
del total de tierras. pulpa de madera (round pulpwood) 


10: Madera blanda (softwood) como $a 


2 Volume { Ё Le А 
olumen Фе shock creciente por асте de la producción de pulpa de ma- 


de bosque comercializable. 


dera. 
3: Volumen de stock creciente en bos- 11: Número de fábricas que usan pul: 
ques comercializables. pa de madera dentro de un radio 
de 100 millas de radio del centro 
4: Madera blanda fsoftwood) como © del municipio. 
del total del volumen de stock cre 
ciente. 12: Capacidad total productiva de las 


fábricas que usan pulpa de madera. 


+ % de bosques en propiedad pública. 13: Número de campos madereros y 


= i i ; > firmas contraciantes, 
6: Diferencia de elevación máxima. ; 


14: Empleo en campos madereros y 


7: % de superficie com pendiente firmas contractanbes. 
suave. А 
15: Número total de industrias made: 
3: Millas de carreteras por milla cua rera у de productos derivados de 
drada de superficie total, la madera, 


A A A СЕТТЕ ЕЕЕ 


Los grupos son todos los municipios de Pensilvania, excepto Delaware y Filadelfia, 
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esto es, 65 municipios. 

El segundo paso utilizado por los autores fue el agrupamiento de municipios. La 
técnica utilizada fue el análisis discriminante stepwise que corresponde a nuestro 
segundo paso (selección de variables para su inclusión en el análisis). Resultaron 
seleccionados 8 grupos que forman subregiones compactas, tal como aparecen en la 
figura 5: 


FIGURA 5. Ocho grupos de municipios en Pensilvania 
formados por análisis diseriminantes. 


A continuación se calcularon las medidas de distancia generalizada (Р?) o medida de 
similaridad entre pares de grupos; basada en valores F, cuyos resultados fueron los 
siguientes: 


Tabla 2 Falores DE 
Grupo 1 2 3 4 5 ё 7 
1 205.2 
2 1279.6 m 
y 1854.35 287.4 ыйа 
1 506.1 494,2 1219.5 Ну 
Е, 735.3 708.1 2394.35 1497,7 тек 
G 600.0 161.2 1335.8 251.0 664.5 
7 158.0 183.9 1 112.2 492.8 306.8 304.8 
% 


24784 210.4 1204.6 398,3 16125 627.8 1698.5 
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Como puede verse en la tabla, los grupos 1 y 7 son muy similares (tienen los valores 
D? más bajos). Los grupos 2 y 3; 2 y 6; 2 y 8; 4 y 6 también son similares. Por el 
contrario, los grupos 1 y 3; 1 y 8;3 y 5; 5 y 8; 7 y 8 son muy diferentes. 

El programa suministra una distribución gráfica de los valores de las dos primeras 
variables canónicas que muestra gráficamente la distribución en los grupos. Las medias 
de los grupos aparecen identificadas con asteriscos. 

Los autores no proporcionan todos los valores, pero en la figura 6 puede verse que la 
media del grupo 3 está localizada a —4.211 en la primera variable canónica y a +4.016 
en la segunda. La municipalidad de Montgomery que pertenece al grupo 3 tiene como 
coordenadas (—3.237 y +5.959). Las variables canónicas están relacionadas con los 
valores D? y reflejando la similaridad entre los grupos. Puede verse en la figura 6 que los 
grupos 1 y 7 están próximos, mientras que 1 y 8 están alejados. 


FiGURA 6. Municipios agrupados en 8 grupos 


. + ә 8 
Municipio 
Montgomery dra 
le 
| 6 canónica 
a 
А 5 
3 + 
| Media 
А grupo 3 3 т 
3 3 н ` ; | 
А 2 ' i z r 
Primera i я 
variable | ' ' | 
canónica 2 
-7 -6 -5 -4 -3 -2-1 0141 2134 56 7 


z EE. Municipio 
“ 6 ' 

Municipio 4 de Pike 

8 Clecarfield 
. А == 5 
8 

—6 
“7 
-$ 
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El tercer círculo realizado se refiere a una matriz de clasificación para evaluar las 
probabilidades de clasificar los municipios en grupos. El cuadro 3 muestra una matriz 
casi perfecta, con la excepción de tres elementos, lo que indica que la clasificación es 
casi perfecta. 


Con base en la similaridad de valores D? se forman ahora 5 subregiones: 


CUADRO 3, Matriz pera la evaluación de asignación de municipios 
en Б grupos 


—— 


кашаанын аали д... = —— сз жа 


Miúmero de municipios por subregiones 


Subregida — _ —_— == AA O in 
1 2 3 4 5 Ë 7 8 

1 Ч 0 {р и 0 i] 1 ú 

н 0 Ыы] [i 0 ib 11 Ш Ü 

i ü ü 11 й 0 ol ü 0 

і i) 11 (р h [i tl ü 

3 0 11 И 0 й й (ї u 

б й i] 1] ü 0 7 1 0 

Fl | 0 0 0 И 0 10 0 

Я i й И] 0 0 0 0 3 


La combinación de los grupos 1 y el noroeste de la región 7 produce una unidad. Los 
grupos 2 y 8, otra unidad compacta. El grupo 3 queda como está, se combina el grupo 5 
con el nordeste del grupo 7, más 1 municipio del grupo 6. Parte del grupo 4 se combina 
con parte del grupo 6. Dos municipios del grupo 4 se agregan a la combinación del 
grupo 2-8. Quedan así 5 subregiones como aparecen en el mapa de la figura 7. 

Esta reclasificación es sometida nuevamente a un análisis discriminante para 
controlar la reclasificación, produciendo los resultados la matriz del cuadro 4 que 
muestra una clasificación perfecta. 
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FIGURA 7. Cinco subregiones de municipios en Pensilvania 
formados por andlisis discriminante 


Cuanto 4, Matriz para la evaluación de asignación de municipios 
a 5 subregiones 


Número de municibios por subregiones 


Subregión (€ A УНИАН АЦЕ шшш; 
I Fi 3 4 5 
і 16 0 0 0 ñ 
2 0 14 0 g ü 
3 0 ü 11 її 0 
1 0 0 0 11 0 
$ 0 0 ü 0 15 


Al mismo tiempo, la distribución gráfica de las nuevas variables canónicas muestra 
una completa separación entre los grupos, excepto para los grupos 1 y 5. Las variables 
canónicas de la figura 8 separan estos grupos. 

Aunque resultante de una combinación de análisis discriminantes con técnicas de 
cluster analysis, se ve claramente cómo la técnica puede ser útil para aplicar criterios 
objetivos en la determinación de subregiones. 

La técnica del análisis discriminante encuentra numerosas aplicaciones en el campo 
de la medicina (para la determinación de síndromes y eventualmente para diagnósticos 
más objetivos), en psicología, economía, etcétera. 


345 


FIGURA 8. Municipios agrupados en 5 subregiones 
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ANÁLISIS DE ESCALOGRAMA GUTTMAN (SUBPROGRAMA GUTTMAN SCALE) 


La escala Guttman, conocida como “método del escalograma” o “análisis de 
escalograma”, tiene como objetivo definir lo más claramente posible qué es lo que está 
midiendo la escala, entendido esto como un problema de unidimensionalidad. Por el tipo 
especial de tratamiento al que se somete la escala, se busca la eliminación de factores 
extraños a las características o dimensión que se pretende medir. 
La segunda característica de una escala Guttman es su propiedad de escala 
acumulativa, es decir que la respuesta positiva a un ítem supone que los ítems anteriores 
han sido respondidos en forma afirmativa. Se busca pues una coherencia en las pautas de 
respuesta de los sujetos, y esa coherencia es garantizada por medio de un coeficiente de 
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reproducibilidad. El tamaño del coeficiente (su valor máximo es 1.00) indica el grado еп 
que la escala es acumulativa. En una escala cuya reproducibilidad es perfecta (1.00), las 
respuestas de los sujetos a todos los ítems pueden ser reproducidas con el solo 
conocimiento de la posición de rango. El escalograma Guttman combina aspectos de 


construcción utilizados por las escalas Lickert y Thurstone.” A partir de una serie de 
ítems que son administrados a una muestra de sujetos que van a actuar como jueces, se 
procede a un análisis de los ítems en su conjunto, buscando la producción de una serie 
acumulativa de ítems. Los jueces se ordenan en término de los puntajes obtenidos en la 
escala, así como los ítems por grado de dificultad. Cuando la serie acumulativa de ítems 
es perfecta, todas las celdas cruzadas en el escalograma estarán en una posición sobre la 
diagonal que corre desde el ángulo superior izquierdo hasta el ángulo inferior derecho de 
la matriz. A más alto número de desviaciones de esta diagonal, mayor número de 
errores, es decir, menor reproducibilidad. 

La idea, pues, es producir cortes y seleccionar ítems de manera tal que la 
reproducibilidad se maxímice. 

El cuadro que sigue muestra un análisis de escalograma con las respuestas de 20 
jueces a 6 ítems, en términos de acuerdo-desacuerdo. Los acuerdos aparecen señalados 
con una х y los desacuerdos con un 0. Los valores encerrados en círculos son errores. 
(Cuadro 5.) 

Las técnicas usadas para la determinación de los cutting points, esto es, los puntos 
que determinan el ordenamiento de los ítems, son básicamente dos (técnica de Cornell y 
técnica de Goodenough). La técnica de Cornell se realiza estableciendo puntos de 
separación en el orden de rango de los jueces, tales como se definirían éstos si la escala 
fuese perfecta. La técnica de Goodenough se basa en el cálculo de errores en base a 
pautas marginales. 

Las posibilidades de establecimiento de cutting-points en escalas más complejas, esto 
es, con ítems con mayores categorías de respuesta que los presentados en el ejemplo 
anterior, obligan la mayoría de las veces a la reclasificación de categorías, 
simplificándolas. El cuadro 5 muestra un ejemplo algo más complejo. 
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Cuanto 5. Andlisis de escalograma. Respuestas de 20 jueces a б items 
en términos de acuerdo-dezacuerdo 
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Como puede observarse, existen bastantes sujetos “fuera de posición” (en el ítem 1, 
hay varios sujetos que respondieron 4, y están por debajo de sujetos que respondieron 3; 
lo mismo hay sujetos que respondieron 1 en el ítem y tienen puntajes totales por encima 
de sujetos que dieron respuesta 2, 3 y 4). Los únicos sujetos que no tienen errores en este 
ítem son los que dieron respuesta 2. Se trata entonces de recombinar las categorías de 
respuesta de manera de minimizar los errores. Supongamos que las reclasificaciones 
propuestas para cada ítem, con sus respectivos pesos, son ahora las siguientes: 


Лет Combinaciones Nuevos pesos 
+ 3 210 2 1 0 
2 4,5 2,1,0 гч 0 
3 4,3 2,1,0 а 0 
4 4,52 1,0 2 0 
5 4,3 2,1,0 2 0 
Б 4,3,2 1,0 2 0 


Naturalmente, los puntajes totales de algunos sujetos variarán, alternando 
consecuentemente su orden de rango. El lector puede reconstituir la tabla. 


CUADRO б. Análisis de escalograma. Ordenación de puntajes y valores 
de respuesta en 6 items tipo escala Lickert 
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Los cutting-points en la técnica de Goodenough se determinan según la distribución 
de las respuestas de los jueces a cada una de las alternativas en los distintos ítems. Los 
cálculos para el cuadro 6 nos darían los siguientes valores: 
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Categorias 
ма [oia Jpop 
toc ЕЕЕ ЕЛЕЕ: 


Los cutting-points рага cada uno de los ítems deben seguir entonces para cada ítem, 
los porcentajes respectivos. En el caso del ítem 1, los cortes serían entonces: 


Es decir que en ítem 1, el primer corte o cutting-point caería entre el último sujeto con 
puntaje total 10 y el primero con puntaje total 9. Y así sucesivamente para el resto de los 
Ítems. 

Mediante estos cutting-points, se уап а determinar pautas de respuestas 
correspondientes a cada corte. La pauta de respuesta es la manera “correcta” en que 
deberían distribuirse para cada puntaje total de cada juez si la escala tuviera perfecta 
escalabilidad. Cada respuesta que no sigue la pauta de respuesta ideal se considera un 
“error”. En nuestro ejemplo, un juez con puntaje 8 debe seguir una pauta: 0-0-2-2-2—2. 
Un sujeto con puntaje 6 debe consecuentemente tener una pauta de respuesta 0-0-0-2— 
2—2. Es decir que primero hay que ordenar los ítems en términos de escalabilidad, para 
luego determinar las pautas correspondientes a cada valor. El principio de la técnica es 
bastante simple. Para 4 ítems dicotomizados y con valores de 1 y 0 para alternativas de 
respuesta “de acuerdo” y “en desacuerdo”, respectivamente, un puntaje total de 3 puede 
seguir cuatro tipos de pautas diferentes: 
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a) 0111 
b) 1011 
с) 1 10 1 
d) 1110 


De estas pautas, solamente la primera es correcta, para ítems que están ordenados en 
forma acumulativa. Cada una de las pautas b, с y d tiene respectivamente 2 errores (uno 
por tener un / donde debería haber un 0, y otro por tener un 0 donde debería tener un /). 
Para hacer más claro el método, vamos a dar un ejemplo más simple, en el que 
presentamos 4 ítems dicotomizados, las pautas de respuesta y el cálculo de los errores. 


7 1 Puntaje Pau a й 
пи Т Раш spuesta ores | 
total | 


Ítems 
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Total errores 


El coeficiente de reproducibilidad se calcula según la fórmula ya conocida de: 


cantidad de errores 


ry = l — aeee a IMMMiŘŘIii 
número total de respuestas 


El ejemplo arriba citado: 7, = 1 — — = .90. 
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El coeficiente de reproducibilidad nos indica la proporción de respuestas a los ítems 
que pueden ser correctamente reproducidas. 

Presentamos ahora dos ejemplos, a partir de los cuales presentaremos criterios 
adicionales al coeficiente de reproducibilidad para la determinación del universo de 
contenido en la escala de Guttman. (Cuadro 7.) 


Cálculo universo de contenido para el cuadro 7 


Ejemplo A Ejemplo B 


Coeficiente de reproducibilidad: 949 1.00 
Rango marginal mínimo: 72 60 
Alcance de distribución marginal: ‚229 40 
REFERENCIAS: 
Ejemplo А Ejemplo B 
Пет 1: Alejamiento de aguas servidas a Item 1: Pileta de lavado. 


pozo ciego y cámara séptica. 
Пет 2: Inodoro. 
Item 2: Agua corriente. 
Пет 3: Ducha. 
Пет 3: Eliminador de residuos. 
Пет 4: Revestimiento de cemento o 
Item 4: Techo de zinc, o loza o teja con superior en baño o letrina. 
aislación. 


Item 5: Piso de cemento o mejor. 
Пет 6: Luz eléctrica. 


La х indica presencia del ítem en ambos ejemplos. 

El coeficiente de reproducibilidad en el ejemplo B, cuyo valor es 1.00, nos permite 
decir, sin tener en cuenta la distribución gráfica, que el sujeto 18 tiene en su casa 
únicamente revestimiento de cemento, o mejor en su baño; mientras que el sujeto 33, 
cuyo puntaje es 3, tiene revestimiento, inodoro y ducha, pero no pileta de lavado. 
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Сулрко 7. Escalograma Guttman para la medición de nivel de vida deter- 
minada en función de materiales empleados en la construcción de viviendas 
y de las instalaciones sanitarias. Muestra de población de Colombres en el 
Departamento de Santa Cruz en Tucumán-Argentina. 
Respuestas de 33 jefes de familia 


Ejemplo A. Vivienda Ejemplo В. Instalaciones sanitarias 
Ítems Ítems 
Sujetos Sujetos 
1 2 3 4 5 1 2 3 4 
1 х x х х х х 3 х х х х 
33 х х х х х х 15 х х х х 
31 Е х х х х х 17 х х х х 
22 х х х х х х 7 х х Y Xx 
19 х х х х х х 11 х х х х 
16 х х х х х х 50 х х х х 
4 х х х х х х 2 х х х х 
6 x х х х E 1 х х х x 
3 х х х х х + х х х х 
15 х х х х х 5 х х х х 
17 х x x х х 8 х х х 
14 х х х x x 6 x x x 
7 х х х х х 33 х х х 
2 x х х х х 31 х х х 
18 х х х х х 22 х х х 
5 х х х х 19 х х х 
8 х х х х 16 х х x 
11 х х х х 14 х х х 
30 х х х х 9 х 
29 х х х 18 х 
9 х х х 13 
13 х х 25 
10 х х 24 
26 х х 29 
28 х х 27 
24 х 26 
27 х 32 
20 х 12 
21 х 20 
25 28 
12 23 
23 10 
32 21 


Es muy difícil lograr escalabilidad perfecta, y consecuentemente, existen errores que 
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van a ser interpretados como errores de reproducibilidad. Guttman aconseja que los 
coeficientes de reproducibilidad no sean menos de .90. 

El coeficiente de reproducibilidad (7,) es un criterio necesario, pero no suficiente para 
la determinación de la escalabilidad de los ítems. Deben tomarse en cuenta otros 
factores. Stouffer et. al., señalan cuatro criterios adicionales: a) Alcance de la 
distribución marginal; Б) Pauta de errores; с) Número de ítems en la escala; y 4) Número 
de categorías de respuestas. 


a) Alcance de la distribución marginal 


Es el más importante de los criterios adicionales, y debe acompañar al coeficiente de 
reproducibilidad. El criterio de distribución marginal es determinado por el rango 
marginal mínimo (MMR) que consiste en el r, menos el promedio de los modos de las 
frecuencias relativas de las distribuciones de los ítems (7, — ММК). 

Para algunos, los valores de este criterio adicional deben variar entre .15 y .35; para 
otros el mínimo debe ser mayor que .10. Estos valores indican la escalabilidad de los 
ítems, dato que no es proporcionado por el r, de manera completa; es decir, es posible 
alcanzar valores altos de r, —digamos .90— y resultar una escalabilidad inaceptable. 
Éste es el caso en el cual los cutting-points están muy próximos entre sí, con el resultado 
de discriminar solamente en los extremos de la escala y no a lo largo de la misma. En 
nuestro ejemplo, los valores de r, son altos y muy aceptables; los alcances de la 
distribución marginal, en cambio, son aceptables para el ejemplo А, y demasiado altos 
para el ejemplo B. 


b) Pauta de errores 


Cuando el r, es menor que .90, pero es escalable, es decir que tiene un 7, MMR mayor 
que .10, estamos en presencia de más de una variable, mejor dicho, de una variable 
dominante y de otra u otras menores; en el área a través de la cual se ordenan los sujetos, 
este tipo de escalograma es denominado cuasi-escala. Éste no es el caso de los dos 
ejemplos que presentamos. 


с) Número de ítems en la escala 


A mayor número de ítems, mayor seguridad de que el universo, del cual estos ítems son 
una muestra, es escalable. 

Por eso, cuando los ítems están dicotomizados, como es el caso en nuestros ejemplos, 
es aconsejable que su número sea mayor que 10. Pero puede usarse un número menor de 
ítems 51 las frecuencias marginales se colocan en un rango con recorridos del 30% al 
70%. 

En los ejemplos dados por nosotros, el rango de frecuencias es: 
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Ejemplo A Ejemplo E 


йет 1......... 24% jum 1......... 350% 
LE cr 579 (еш ?......... 559 
бет J ......... 609% Lem %......... 55% 
[шш 4 ........ ‚ 60% йш $ ........ ‚ йб 
tem 5 . 185 
tem 6 . 87%, 


Tenemos alguna seguridad, de acuerdo al requisito citado más arriba, de que el 
universo se comporta como la muestra. 


d) Número de categorías de respuestas 


Es otro criterio para asegurar la escalabilidad; cuanto mayor el número de categorías, 
mayor la seguridad de que el universo es escalable. Por ello, a pesar de la necesidad de 
reducir las categorías por razones prácticas (disminución del número de errores), hay que 
asegurarse de que tal reducción no es la resultante de obtener frecuencias marginales 
extremas (.90—.10) que, como vimos más arriba, no permiten errores, pero 
artificialmente. 

51 mantenemos el número de alternativas de respuestas, a pesar de que aumentará el 
número de errores, disminuimos la posibilidad de que aparezca una pauta escalable 
cuando de hecho el universo no lo es. 

El out-put del subprograma Guttman scale tiene la siguiente forma (suministramos 
los datos correspondientes al texto en el SPSS op. cit.): 

Se trata de 3 ítems: /) Miembro de organizaciones orientadas hacia el servicio. 2) 
Miembros de organizaciones ocupacionales. 3) Miembro de grupos recreacionales. 


Recre. (3) Org. Ог. (2) М.О. 5. (1) 
0 1 о 1 0 1 
Er =—— Ër — EM ema 
3 0 18 0 1% 0 13 15 
2 32 17 10 39 ї 42 49 
і 108 12 66 24 66 54 120 
0 168 0 168 0 168 0 168 
Sumas 380 б Е 244 106 241 109 350 
% 88 12 70 30 69 31 


Coeficiente de reproducibilidad : 419 
Reproducibilidad marginal mínima: .7552 
Porcentaje de mejoramiento : 807 
Cocliciente de escalabilidad : bil 


Coeficientes de correlación 


-—— -c A o [X—— c o 


Far. Í Far. 2 Far, 1 
War. | 1 (ИН) 24065 -5151 
Маг. 2 -F196 1.000 4024 
Мат. 3 5151 ADZA 1.0000 
Escala 
Пет 2958 2565 ‚5490 


Los cutting-points se realizaron con una técnica similar a la Goodenough algo más 
simple que la especificada más arriba. 

El cuadro se puede leer de la misma forma que el primero que presentamos más 
arriba. La diferencia es que aquí se representan en una doble columna los valores 
afirmativos (la x se remplaza con un 1); y los negativos (se representan con un 0). En la 
primera columna de la tabla figuran los valores 3, 2, 1, 0 que representan los posibles 
puntajes y que nos sirven para la determinación de los cuttings-points y por lo tanto para 
contar los errores. Un puntaje tres representa una pauta de respuesta 1 1 1; un puntaje 
dos representa una pauta 0 1 1 (siendo error por ejemplo 101 y 110); una pauta de 
respuesta de 1 es del tipo 0 0 1 (y no 100, 010). Examinando ahora el ítem que quedó 
ordenado como en primer lugar y que es el que más discrimina (solamente 12% de los 
sujetos dieron respuesta afirmativa), vemos que para el valor O del ítem no existe error 
pero sí hay 29 errores por debajo del cutting point (sujetos que han contestado 
afirmativamente el ítem y cuyo puntaje era menor que 3). En el ítem 2 existen 64 errores, 
10 errores en 0 y 54 errores en 1; y en el ítem 3 hay 73 errores. El total de sujetos fue de 
350, y es el resultado de la suma de la última columna, cuyos parciales indican la 
cantidad de sujetos que obtuvieron puntaje 3, 2, 1 y 0, respectivamente. 

El coeficiente de reproducibilidad en el ejemplo es bastante bajo, y de haberse 
incluido más ítems en la escala, podría haberse eliminado algunos con el fin de aumentar 
la reproducibilidad, ya que la idea general es precisamente utilizar el escalograma para 
seleccionar ítems escalables. 

El rango marginal mínimo nos da un valor que, restado del coeficiente de 
reproducibilidad, proporciona el porcentaje de mejoramiento o, como preferimos 
llamarle, alcance de la distribución marginal. En este caso el valor es de .1731, muy 
aceptable. 

El coeficiente de escalabilidad corresponde a nuestra pauta de errores y en el ejemplo 
que presentamos representa un valor de .3541, muy bajo, e indica que la escala no es 


356 


unidimensional (los coeficientes deben ser mayores que .70). 

Finalmente, las correlaciones que aparecen al fondo de la tabla son coeficientes Q de 
Yule para la correlación inter ítems, y coeficientes biseriales para la intercorrelación de 
cada uno de los ítems con la suma del resto de los otros ítems. Con esto podemos 
analizar los ítems que no se correlacionan, ya sea con los otros ítems, ya sea con los 
valores de escala. 
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X. LA PRESENTACIÓN DEL INFORME DE INVESTIGACIÓN 
INGVAR AHMAN 


EN ESTE último capítulo, nuestro interés se centra en la presentación del informe de 
investigación. Más exactamente, se trata de proponer diferentes pasos en una 
investigación, el modo en que pueden ser presentados y cuáles instrumentos 
metodológicos deberían ser incluidos. Creemos que la forma de una checklist es la más 
apropiada para estos fines. Sin embargo, si el estudio se hubiera efectuado de manera 
distinta de la forma expuesta en este libro, algunos de los puntos de la checklist, 
naturalmente, deben dejarse de lado y no considerarse; si hubo algún estudio tipo 
observación participante, por ejemplo, el cuestionario se cambia por una cédula 
estandarizada de registro de las observaciones; si el estudio fue de tipo más cualitativo y 
no existió la cédula, no se considera el punto, etcétera. 

La idea, con respecto a esta lista, y tal como hemos venido insistiendo, es acentuar los 
siguientes puntos: a) la presentación, por parte del investigador, tanto de sus sistemas de 
hipótesis como de sus hallazgos, en una forma sistematizada; b) la inclusión de una 
descripción metodológica profunda que explique cómo se han obtenido los resultados; c) 
la presentación de los instrumentos utilizados en su forma original. 

Con lo anterior, obtenemos los siguientes beneficios fundamentales: a) facilitar una 
simple inspección de los hallazgos obtenidos; b) facilitar la comparación con otros 
estudios efectuados en el mismo pais y entre estudios en diferentes países; c) facilitar la 
replicación de la investigación completa, de baterías de preguntas y de escalas, así como 
la reformulación y mejoramiento de la calidad de posibles estudios en el futuro; d) 
facilitar, por las razones anteriores, la acumulación e incremento de hipótesis que ayuden 
en la formación y remodelación de la teoría. 


La lista de control (check list) 


1) El problema general. En este punto, el autor debe introducir la relación del problema 
tratado por la investigación con teorías específicas y generales. Se presenta, además, el 
sistema de hipótesis que se quiere investigar empíricamente. Esta presentación debe 
incluir abstracciones del sistema de hipótesis. Es decir, si es posible, resumirlo en forma 
de diagrama y fórmulas con símbolos. Asimismo, el análisis de otras investigaciones 
empíricas que han abordado el problema o aspectos de él, los resultados de estos 
estudios y su conexión con el modelo utilizado en la investigación que se comunica. Si el 
estudio actual fue influido por otro o si se han utilizado conceptos, modelos o 
instrumentos de otros estudios, éstos deben ser presentados aquí. 

2) Diseño del estudio. El autor presentará el diseño que ha seleccionado para 
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investigar el problema, qué otras alternativas existían y por qué ha concluido por elegir 
la forma seleccionada. A esto hay que agregar la presentación de la técnica utilizada para 
la obtención de los datos y una breve explicación acerca de la unidad elegida. (Ejemplo: 
individuos masculinos de más de 20 años; familias; fábricas de tejidos; provincias; 
naciones; etcétera.) 

En seguida, es necesario explicar las características de la población, incluyendo una 
descripción de las que han desempeñado algún papel de importancia en la selección de la 
muestra. Si el investigador, por razones económicas o de tiempo, ha extraído una 
muestra de la población, será necesario explicar el diseño de la muestra y las 
justificaciones que se han considerado para su selección y forma. El tamaño 
seleccionado y los problemas y limitaciones serán también de importancia. 

3) La descripción del grupo o de los grupos estudiados. El autor debe presentar aquí 
la descripción de los grupos (o del grupo) estudiados, en base a conocimientos anteriores 
о pautas obtenidas en la investigación. Se trata de obtener una idea de las distribuciones 
de las variables de fondo para poder estimar mejor la parte explicativa del estudio. Las 
variables pueden ser de tipo ecológico, personal, contextual, etc. Además, una 
presentación descriptiva tiene, a veces, su propio valor, particularmente si el estudio está 
hecho en un campo desconocido o poco conocido. 

4) La medición de las variables investigadas. Se concentra en las variables incluidas 
en el sistema de hipótesis y en la forma en que fueron medidas estas variables a través 
del instrumento utilizado en la colección de datos. Conviene empezar esta presentación 
con: a) las variables independientes: ¿cuáles fueron consideradas así en el esquema de 
análisis y qué forma de medición se aplicó? (Tipos de escalas que representan las 
variables: ¿nominales, ordinales, intervales?) b) Las variables de “background”. ¿Qué se 
hizo en el diseño del estudio para controlar estas variables? ¿Cuáles fueron controladas?, 
etc. c) La presentación de la variable o las variables dependientes. ¿A qué nivel de 
medición (nominal, ordinal o intervalar) fue posible conseguir información en la 
variable? ¿Cuáles fueron las definiciones conceptuales? d) Estimación del grado de 
confiabilidad y validez en la medición de las variables en a, b y c. Si el investigador ha 
utilizado algunas técnicas o pruebas para comprobar el grado de confiabilidad y validez, 
es necesario incluir el tipo de prueba y una descripción del proceso. ¿Habrá otros 
métodos para verificar la confiabilidad y la validez en este tipo de estudios? 

5) Parte metodológica. Se presenta una descripción del proceso utilizado para obtener 
los datos y de las facilidades y dificultades surgidas en el trabajo. ¿Cuáles fueron las 
instrucciones especiales dadas a los entrevistadores? ¿En qué manera se ha obtenido un 
incremento del grado de motivación con los entrevistados, frente a la entrevista misma? 
¿Cuáles fueron, en general, las relaciones entre los entrevistadores y los entrevistados? 
¿Cuáles fueron las relaciones entre la investigación y el público en general, antes, 
durante y después del estudio? 

Debe presentarse, también, un análisis de la pérdida de información que ha sufrido el 
estudio. Un tipo de pérdida se refiere al grado de obtención de las entrevistas. Si la 
muestra fue extraída al azar, no se pueden sustituir personas que no pudieron ser 


359 


entrevistadas, por otras. Este último razonamiento es aplicable en aquellos casos еп que 
los cuestionarios son enviados por correo u otro tipo de investigaciones especiales donde 
el porcentaje de rechazos en sí mismos refleja características que son significativas para 
el estudio. Debe anotarse el porcentaje de pérdida, así como algunos comentarios que 
justifiquen este porcentaje. Sin embargo, es posible construir diseños muestrales que 
contemplen casos de reservas que remplacen los rechazos. Otro tipo de pérdida puede 
referirse al grado de información perdida dentro de cada unidad (de cada entrevista). 
Ésta varía entre diferentes preguntas y diferentes baterías de preguntas y puede ser 
presentada y criticada por el autor. En esta parte es necesario incluir las relaciones del 
costo y tiempo necesario para efectuar el estudio. 

Una parte puede presentar tipos de procesamiento de datos utilizados y una 
explicación de los tipos de análisis elaborados. 

6) Las relaciones encontradas. La presentación de los hallazgos y relaciones 
encontradas en el estudio y sus relaciones con teorías conocidas. 

Si se presenta el grado de relación entre las variables a través de tests estadísticos, 
debe también explicarse el tipo de tests aplicados y el grado de significancia existente. 
Se deben comparar los resultados obtenidos con los encontrados en otros estudios 
similares y, a la vez, ofrecer sugerencias al avance de una teoría o ideas para futuras 
investigaciones en el área. 

7) Apéndice. Deben presentarse: a) Cuadros completos de correlaciones y otros tipos 
de asociaciones entre variables. Si fueron aplicados tests, se deben incluir los cuadros de 
los cruces y los resultados, con grados de significancia y tipos de tests aplicados. b) Una 
copia del cuestionario aplicado, acompañado de todos los “accesorios” utilizados, tales 
como las instrucciones dadas a los entrevistadores, hojas sueltas utilizadas en la 
entrevista, fotos y tests, etc. c) Una copia del código, especialmente si hay muchas 
preguntas abiertas en el cuestionario. Si el código se parece mucho a las alternativas que 
figuran en el cuestionario, no sería necesario, en tal caso, presentarlo. d) Mapas, 
diagramas completos y cualquier otro material de información. e) Un índice de autores y 
otro de materiales. 
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L LA ORGANIZACIÓN DE UN “SURVEY” 


1 A este respecto, afortunadamente se está generalizando en América Latina la existencia de centros de 


documentación con personal técnico especializado en clasificación, ordenación, etc., de material de 
documentación por área, subáreas, etc., que facilitan enormemente la tediosa tarea para el investigador de 
seleccionar el material relevante. 

2 La documentación descriptiva debe ser sometida a crítica antes de aceptar las conclusiones a que en ella se 
pueda llegar. Sin caer en el hipercriticismo, los documentos deben ser examinados tanto en lo relativo a sus 
características internas como externas, realizando un análisis de las fuentes citadas por los documentos, de los 
intereses que puedan estar modulando la selección de fuentes, capacidad del observador para seleccionar los 
aspectos más relevantes de la situación, o solamente de aquellos que coincidan con su punto de vista. 
Dependiendo del tema de investigación, y sobre todo cuando la documentación es de tipo descriptivo, conviene 
realizar algunos análisis comparativos entre distintas fuentes con el fin de comprobar la existencia de 
contradicciones. 

3 Bustamante, por ejemplo, para realizar su estudio sobre los emigrantes mexicanos a los Estados Unidos (ver 
Bustamante, J.: Mexican Immigration and the Social Relations of Capitalism. Doctoral Dissertation [sociología]; 
University of Notre-Dame, Notre-Dame, Indiana, 1974) entró a la frontera de los Estados Unidos como “espalda 
mojada”, esto es, como emigrante “ilegal”; fue detenido en Texas, encarcelado y enviado de vuelta a México, 
teniendo oportunidad de vivir el proceso en su totalidad. Entrevistó a braceros y adquirió así una gran experiencia 
en el terreno, lo cual dio a su trabajo una riqueza imposible de lograr por el simple análisis abstracto de la 
situación. 

4 Hyman, Н., et al., Interviewing in Social Research; The University of Chicago Press, Chicago, 1965. 

5 Existe buena bibliografía especializada sobre el tema; entre otros recomendamos: Kahn, R., y Cannell, Ch.: 


The Dynamics of Interviewing: Theory, Techniques and Cases; John Wiley & Sons, Nueva York, 1962. 
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П. EL PROCESO DE INVESTIGACIÓN 


l Ésta es la diferenciación que hace Galtung en Teoría y métodos de la investigación social; Eudeba, Buenos 
Aires, 1966. Nosotros preferimos diferenciar los estudios en descriptivos y explicativos según se basen en 
definiciones o proposiciones. 

2 La realidad no se da en el análisis sino que es reconstruida en el proceso analítico mismo. No medimos а 
realidad, sino que medimos en la realidad, mediante la traducción del “objeto real” en un “objeto científico”, a 
través de un haz de conceptos que tienen significados nominales para una teoría general o particular (ver Castell, 
M.: Problemas epistemológicos implícitos en la práctica sociológica-FLACSO; Santiago de Chile, 1968). 

3 Riley, M.: Sociological Research: A Case Approach; Harcourt, Brace & World, Nueva York, 1963. 

4 El lector interesado en el problema puede recurrir a una abundante bibliografía especializada, entre otros 
recomendamos: Brodbeck M. (ed.): Readings in the Philosophy of the Social Sciences; The McMillan Co., Nueva 
York, 1968; Krimerman, L.: The Nature and Scope of Social Science: A Critical Anthology; Appleton-Century- 
Crofts, Nueva York, 1969; Kaplan, A.: The Conduct of Inquiry. Methodology of Behavioral Sciences; Chandler 
Publ. Co., San Francisco, 1964; Bachelard, G.: La formación del espiritu científico. Contribución a un 
psicoanálisis del conocimiento objetivo; Siglo XXI, Buenos Aires, 1972; Bourdieu, P., Passeron, J. С., 
Chamboredon, J. C.: Le Métier de Sociologue; Mouton Bordas, París, 1968. 

5 Zetterberg H.: On Theory and Verification in Sociology; The Bedminster Press Nueva York, 1965 (3* ed.). 

6 Piaget, J.: “La situación de las ciencias del hombre dentro del sistema de las ciencias”, en Piaget, J., 
Mackenzie, W., Lazarsfeld P., y otros, Tendencias de la investigación en las ciencias sociales; Alianza 
Universidad, UNESCO, 1970. 

7 Bunge, M.: La ciencia, su método y su filosofía; Siglo XX, Buenos Aires, 1970; y Causalidad: el principio 
de la causalidad en la ciencia moderna; Eudeba, Buenos Aires, 1965. 

8 Las preguntas que Zetterberg (ор, cit.) sugiere son: Г) ¿existe un orden subyacente a la realidad social? 2) Si 
es así, ¿se han descubierto algunas leyes sociológicas? 3) Si es así, ¿se han combinado esas leyes en teorías que 
explican la realidad social? 4) Si es así, ¿se han utilizado esas teorías para calcular soluciones a problemas 
prácticos? 

? La naturaleza de la explicación en ciencias sociales involucra no solamente una serie de argumentos sobre el 
estatuto de la explicación como conocimiento científico (ver, por ejemplo, Padua, J.: “Estudios globales y estudios 
parciales: un análisis desde la perspectiva epistemológica”, ponencia presentada en el Seminario sobre 
Interrelaciones entre la Dinámica Demográfica y la Estructura y Desarrollo Agrícola, en Cuernavaca, México, 
noviembre de 1974), sino que tiene que ver con el tipo de explicación más apropiada a los fenómenos sociales 
(teleológica, cuasiteleológica, no teleológica, probabilística, genética-estructural, etc.). No entramos a considerar 
estos argumentos en este texto, pero recomendamos parte de la bibliografía que se cita en la primera parte de este 
capítulo, con el agregado tal vez del texto de Nagel, E.: The Structure of Science. Problems in the Logic of 
Scientific Explanation; Harcourt, Brace & World, Nueva York, 1961. 

10 Para una discusión en detalle del tema conviene leer, de Hempel, C.: “Fundamentals of Concept Formation 
in Empirical Science”; International Encyclopedia of Unified Science., vol. П, núm. 7; y de Blalock, H.: Theory 
Construction; Prentice-Hall, Nueva Jersey, 1969. 

11 Beveridge, W.: The Art of Scientific Investigation; W. W. Norton Co., Nueva York, 1957. 

12 Para un tratamiento muy penetrante del tema hipótesis, recomendamos la lectura del tomo II de Galtung (op. 
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cit.) que contiene uno de los tratamientos más completos, del cual señalamos aquí solamente algunos puntos 
relevantes a nuestra línea de argumentación. 

13 Un tratamiento bastante extenso del tema puede encontrarse en Zetterberg (op. cit.). 

14 Para un buen desarrollo de lo que se conoce como “serendipiti” ver Merton, R.: Teoría y estructuras 
sociales; FCE, México, 1964. 

15 Adorno, F.-B., et al.: The Authoritarian Personality; Harper and Brothers, Nueva York, 1950. 

16 Lazarsfeld P.: “Evidence and Inference in Social Research”, en Evidence and Inference Lerner et al.; The 
Free Press, Nueva York, 1958. 

17 Existe una abundante bibliografía crítica sobre los estudios de “La personalidad autoritaria”; ver, por 
ejemplo, un buen resumen en Brown, R.: Psicología social; Siglo XXI, México, 1972. Para un análisis más 
profundo ver, por ejemplo, Christie, R., & Jahoda, М. (eds.): Studies in the Scope and Methods of “The 
Authoritarian Personality”; The Free Press, Nueva York, 1954. 

18 La palabra teoría es utilizada aquí en un sentido bastante laxo, para referirnos más que nada al sistema de 
racionalidad que los psicólogos utilizan para “explicar” el origen, naturaleza y desarrollo de la enfermedad (sería 
más exacto hablar de aproximaciones psicoanalíticas, del aprendizaje, biológicas, etc.). Lo mismo ocurre en 
sociología, donde las taxonomías están todavía en estado de aceptación parcial, según la escuela de preferencia de 
algunos autores (hablando de teorías del conflicto, funcionalistas, etcétera). 

19 Buss, A.: Psychopathology; John Wiley and Sons, Nueva York, 1966. 

20 Jahoda, M.: Current Concepts of Positive Mental Health; Basic Books, Nueva York, 1958. 

21 Buss (op. cit.) incluye además en la lista trastornos en los niños, inteligencia subnormal y daños en el 
cerebro. 

22 Las taxonomías más completas pueden verse en Weber, M.: Economía y sociedad (2 tomos); FCE, México, 
1969 (1* reimpr.); y en Parsons, T., y Shieds, E. (ed.). Toward a General Theory of Action; Harper & Row, Nueva 
York, 1951. 


23 Germani, G.: Política y sociedad en una época de transición; Paidós, Buenos Aires, 1968. 
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Ш. MUESTREO 


1 Galtung, J.: Teoría y métodos de la investigación social; Eudeba, Buenos Aires, 1966. 

2 Lazerwitz, B.: “Sampling Theory and Procedures”; en Blalock, H. y Blalock, A., (eds.): Methodology in 
Social Research; McGraw-Hill, Nueva York, 1968. Cochran, W.: Sampling Techniques; 1. Wiley & Sons, Nueva 
York, 1953. Yates, F.: Sampling Methods for Censuses and Surveys; Griffin, Londres, 1953. 

3 Algunos autores, como Galtung, no incluyen este tipo de muestra entre las probabilísticas, ya que los 
procedimientos de muestreo rompen el principio de aleatoriedad. Este mismo problema surge en el caso de las 
muestras sistemáticas, en la medida en que, una vez seleccionada la primera unidad, la probabilidad de las 
unidades siguientes es cero o uno, es decir que luego de seleccionada la primera unidad la muestra es finalista. 

4 Al lector no familiarizado con los problemas de la estadística inferencial recomendamos nuestro capítulo 
sobre conceptos estadísticos básicos, o algún texto sobre estadística; recomendamos especialmente: Social 
Statistics de Blalock, H.; McGraw-Hill Kogakusha, Tokio, 1972. (Ed. en español: Estadística social; Fondo de 
Cultura Económica, México, 1979.) 

5 Galtung, op. cit., pp. 65 a 67. 

6 Tabla extraída de Galtung, ор. cit., р. 66. 

7 Extraída de Blalock, H.: Social Statistics; International Student Edition, McGraw-Hill Kogakusha, Tokio, 
1972, p. 555. 

8 Uno puede tomar otro criterio, por supuesto, para definir los conglomerados: región geográfica, cantidad de 
habitantes, etc. Hay que tratar que éstos sean lo más homogéneos posible. En los últimos escalones vamos a 
utilizar criterios diferentes de las divisiones políticas. 


? Galtung, J.: op. cit., pp. 61 y ss. 
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ТУ. EL CUESTIONARIO 


1 Ver capítulos “La organización de un survey” y “El trabajo de campo”. 

2 Existen algunas publicaciones especializadas, tales como las del Institute of Social Research de la 
Universidad de Michigan, muy útiles para la formulación de preguntas o escalas en un cuestionario, además de 
revistas periódicas tales como: American Sociological Review; American Journal of Sociology; Social Forces; 
Psychological Bulletin, etcétera. 

3 Una lista de control para recordar los objetivos que uno tiene que cumplir en una tarea determinada. 

Ы Ejemplo tomado de Duverger, M.: Métodos de las ciencias sociales; Ariel, Barcelona, 1961. 

5 Para detalles de la muestra y del estudio, ver: Faria, R., Ochoa, J., Quevedo, S., y Padua, J.: Estudio del 
Programa de Asistencia Alimenticia Proporcionado por la Junta Nacional de Auxilio Escolar y Becas; ELAS- 
JNAEB, Santiago de Chile, 1967; y El rendimiento escolar: un análisis en base a algunas variables estructurales; 
ELAS-JNAEB, Santiago de Chile, 1968. 
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V. LA CODIFICACIÓN 


* Quiero aprovechar esta oportunidad para señalar mi deuda intelectual con el profesor doctor don Jorge 


Garmendia, no sólo en lo referente a la confección de este trabajo —sin cuyas sugerencias y alientos no hubiera 
sido realizado—, sino en cuanto а mi formación profesional en la metodología de la investigación social. 

l Duverger, M.: Métodos de las ciencias sociales; Ariel, Barcelona. Traducción del original francés, Méthodes 
des Sciencies Sociales; P.U.F., 1961. 

z Hyman, H.: Survey Design and Analysis; The Free Press, Publishers, Glencoe, Ш., 1957. 

3 Selltiz, C., Jahoda, M., Deutsch, M., y Cook, S.: Research Methods in Social Relations; Holt, Rinehart and 
Winston, Nueva York, 1959. 

4 También podemos señalar la definición de Chevry: “La codificación de los cuestionarios es la operación que 
consiste en traducir, utilizando los códigos establecidos para ese fin, las respuestas literales o numéricas en 
indicaciones cifradas que facilitarán la clasificación; las cuales podrán inmediatamente ser transcriptas en 
perforaciones de una columna de una tarjeta perforada”. “Pero puede ser útil también cuando se encara una simple 
explotación manual.” Chevry, G.-R.: Pratique des enquétes statistiques; Press Universitaires de France, 1962. 

5 Para una visión general de los símbolos que pueden emplearse para codificar, véase el apéndice. 

6 Chevry, G., op. cit. 

7 Duverger, M., op. cit. 

8 Duverger, M., op. cit. 

9 Hyman, H., op. cit. 

10 Duverger, op. cit. 

11 Selltiz, C., Jahoda, M., et al., ор. cit. 

12 Chevry, G., op. cit. 

13 Hyman, H., op. cit. 

14 Chevry, G., op. cit. 

15 Selltiz, C., Jahoda, M., et al., op. cit. 

16 Chevry, G., op. cit. 

17 Chevry, G., op. cit. 
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VI. ESCALAS PARA LA MEDICIÓN DE ACTITUDES 


1 Coombs, C. H.: А Theory of Psychological Scaling; Engineering Research Institute, University of Midi 
Ann Arbor, Mich., 1952. 

2 Un ejemplo mucho más claro sería preguntar en qué país nació, o cuál es su sexo. 

3 Stouffer, S., et al.: Studies in Social Psychology in World War П. Measurement and Prediction (vol. ТУ); J. 
Wiley 8 Sons, Nueva York, 1966. 

4 Kretch D., y Cruschfield, R. S.: Theory and Problems of Social Psychology; McGraw-Hill, Nueva York, 
1948. 

3 Newcomb, T. M.: Personality and Social Change: Attitude Formation in a Student Community; Dryden, 
Nueva York, 1943. 

6 Thomas, W., y Znaniecki, F.: The Polish Peasant in Europe and America. 

7 Edwards, A.: Techniques of Attitude Scale Construction; Appletori-Century-Crofts, Nueva York, 1967. 

8 Para llegar al promedio sumamos la columna correspondiente al ítem 1 en los 13 sujetos con puntajes altos 
dividiéndolos por el total de casos: (4+4+3+4+4+4+4+3+4+3+3+4+4)/13. En forma idéntica, para el grupo bajo el 
cálculo es: (2+0+2+1+0+1+0+1+2+3+0+0+0)/13. 

? Stouffer, S., et al.: Studies in Social Psychology in World War П. Measurement and Prediction, vol. ТУ; 1. 
Wiley 8 Sons, Nueva York, 1966. 
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УП. EL TRABAJO DE CAMPO 


1 R = Respondente. 
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УШ. ANÁLISIS DE DATOS: EL CONCEPTO DE PROPIEDAD-ESPACIO Y LA UTILIZACIÓN DE 
RAZONES, TASAS, PROPORCIONES Y PORCENTAJES 


1 Consideramos en este capítulo Únicamente razones, tasas, proporciones y porcentajes. En el capítulo de Jorge 
Padua se consideran modelos estadísticos más sofisticados y para niveles de medición ordinales e intervalares, 
además de los nominales. 

2 NES = Nivel socioeconómico. 

3 Para más detalles sobre el tema consultar: Barton, A.: “The Concept of Property-Space in Social Research”, 
en Lazarsfeld, P., y Rosemberg, M.: The Language of Social Research; The Free Press, Nueva York, 1955. 

4 Gerth, H., y С. W. Mills.: Carácter y estructura social; Paidós, Buenos Aires, 1963. 

5 Heintz, P.: Curso de sociología; Eudeba, Buenos Aires, 1965. 

6 Barton, A.: ор. cit. 

7 Zeigel, H.: Dígalo con números. Fondo de Cultura Económica, México, 1961. 

8 Hovland, С. J., et. al.: “A Baseline for the Measurement of Percentage Change”, en Lazarsfeld, P., y 
Rosenberg, M.: The Language of Social Research; The Free Press, Nueva York, 1965. 
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IX. ANÁLISIS DE DATOS: PAQUETE ESTADÍSTICO PARA LAS CIENCIAS SOCIALES (SPSS): OFERTA 
Y CONDICIONES PARA SU UTILIZACIÓN E INTERPRETACIÓN DE RESULTADOS 


1 Guilford, J. P.: Psychometric Methods; McGraw-Hill, Nueva York, 1954. 

2 Blalock, H.: Social Statistics, McGraw-Hill, Kogahusha, Tokio, Japón, 1972 (2* ed.). 

3 Salvo en el caso de utilizar la correlación parcial para predicciones en la utilización de regresiones en cuyo 
caso se acostumbra a interpretar r;> з, denotando 1 la variable dependiente, 2 la variable independiente y 3 la 
variable de control. 

4 Kim J.-O., y Kohout F.: “Multiple Regression Analysis: Subprogram Regression”, en Nie, N., Hull, C. H., 
Jenkins, J., et. al.: Statistical Package for the Social Sciences: McGraw-Hill, Nueva York, 1975, 2* ed.. 

5 La inclusión de todas las variables mudas resultantes de categorías nominales hace que las ecuaciones 
normales no puedan ser resueltas, ya que la inclusión de las últimas categorías está completamente determinada 
por los valores de las primeras categorías ya incluidas en la ecuación. 

6 Gansner, D., Seegrist, D., Walton G.: “Technique for Defining Subareas for Regional Analysis”, en Growth 
and Change; octubre, 1971. 

7 Para más detalles, puede verse el capítulo correspondiente a escalas. 

8 Stouffer, S., et al.: Measurement and Prediction. Studies in Social Psychology in World War П, vol. IV; 


Princeton University. 
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En las ciencias sociales es parte esencial de la investigación 
el acopio de datos mediante el contacto directo o indirecto 
con informantes. Las técnicas al respecto dependen del 
problema y del género de interrogantes que la indagación 
sugiera, del planteamiento teórico general de ésta y de la 
etapa en que se halle la teoría sustantiva. 

El presente manual describe los aspectos operativos de 
la investigación, entre ellos la estructuración de los cuestio- 
narios para la recolección de datos; además, aborda el pro- 
ceso de organización de la investigación, el ejercicio de 
variables y los procedimientos de muestreo y codificación, 
así como la construcción de escalas, el análisis de la infor- 
mación y las recomendaciones para la presentación del 
informe de la indagación. 

Preparados por cuatro especialistas, todos los capítulos 
han sido escritos para que puedan ser leídos de forma 
independiente, pero están ordenados de manera tal que el 
volumen, en su conjunto, sigue la lógica del proceso de 
investigación. Así, la obra llena un vacío que desafortuna- 
damente existe en la bibliografía especializada, y resulta 
de gran valor tanto para quienes estudian o imparten algún 
curso introductorio de técnica de la investigación como 
para los investigadores que frecuentemente necesitan con- 
sultar los aspectos técnicos de su labor. 
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